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数据 结构 是 研究 计算 机 科学 和 工程 的 基础 ,数据 结构 课程 是 计算 机 
科学 与 技术 专业 及 相关 专业 的 核心 课程 之 一 ,学 好 该 课程 不 仅 对 后 续 课 
程 的 学 习 有 很 大 帮助 ,而 且 对 开发 有 效 利 用 计算 机 资源 的 程序 极为 有 益 。 

计算 机 是 进行 数据 处 理 的 工具 ,数据 结构 主要 研究 数据 的 各 种 组 织 
形式 以 及 建立 在 这 些 结构 之 上 的 各 种 运算 算法 的 实现 , 它 不 仅 为 用 计算 
机 语言 进行 程序 设计 提供 了 方法 性 的 理论 指导 ,还 在 更 高 的 层次 上 总 结 
了 程序 设计 的 常用 方法 和 常用 技巧 。 

本 教程 是 作者 针对 数据 结构 课程 概念 多 、 算 法 灵活 和 抽象 性 强 等 特 
点 ,在 总 结 长 期 教学 经 验 的 基础 上 编写 的 。 全 书 分 为 13 章 和 5 个 附录 ， 
第 1 章 为 绪论 ,介绍 数据 结构 的 基本 概念 ,特别 强调 算法 分 析 的 方法 ; 第 
2 章 为 线性 表 , 介 绍 线性 表 的 两 种 存储 结构 一 一 顺序 表 和 链表 ,以 及 基本 
运算 算法 的 实现 过 程 ; 第 3 章 为 栈 和 队列 ,介绍 这 两 种 特殊 的 线性 结构 的 
概念 与 应 用 ; 第 4 章 为 串 , 介 绍 串 的 概念 与 模式 匹配 算法 ; 第 5 章 为 弟 
归 , 讨 论 计算 机 学 科 中 递归 算法 的 设计 方法 ; 第 6 章 为 数组 和 广义 表 , 介 
绍 数组 ,稀疏 矩阵 和 广义 表 的 概念 与 相关 运算 算法 的 实现 过 程 ; 第 7 章 为 
树 和 二 叉 树 ,介绍 树 和 二 叉 树 的 概念 与 各 种 运算 算法 的 实现 过 程 ,其 中 特 
别 介 绍 二 叉 树 的 各 种 递归 算法 方法 ; 第 8 章 为 图 ,介绍 图 的 概念 和 图 的 各 
种 运算 算法 的 实现 过 程 ; 第 9 章 为 查找 ,介绍 各 种 查找 算法 的 实现 过 程 ; 
第 10 章 为 内 排序 ,介绍 各 种 内 排序 算法 的 实现 过 程 ; 第 11 章 为 外 排序 ， 
介绍 各 种 外 排序 算法 的 实现 过 程 ; 第 12 章 为 文件 ,介绍 各 类 文件 的 组 织 
结构 ; 第 13 章 为 采用 面向 对 象 的 方法 描述 算法 ,介绍 面向 对 象 的 概念 和 
采用 C++ 语言 描述 数据 结构 算法 的 方法 。 

附录 A 给 出 了 实验 报告 格式 ,附录 B 是 引用 型 参数 和 指针 引用 型 参 
数 的 说 明 , 附 录 C 给 出 了 书 中 全 部 算法 的 索引 ,附录 D 给 出 了 书 中 相关 名 
词 的 索引 ,附录 E 为 教育 部 颁布 的 2018 年 全 国 计 算 机 专业 硕士 研究 生 入 
学 考试 专业 课 中 的 数据 结构 部 分 考试 大 纲 。 

数据 结构 是 一 门 应 用 实践 性 非常 强 的 课程 ,学 生 在 掌握 各 种 数据 结 
构 ( 特 别 是 存储 结构 ) 的 基础 上 一 定 要 尽 可 能 多 地 上 机 实习 ,通过 较 多 的 
实验 把 难以 理解 的 抽象 概念 转化 为 实 实在 在 的 能 够 在 计算 机 上 执行 的 程 

















序 ,这 样 才 能 将 所 学 知识 和 实际 应 用 结合 起 来 ,吸取 算法 的 设计 思想 和 精 
髓 , 提 高 运用 这 些 知识 解决 实际 问题 的 能 力 。 因 此 ,本 教程 突出 上 机 实习 内 
容 , 书 中 给 出 了 大 量 的 上 机 实验 题 ( 分 为 验证 性 实验 .设计 性 实验 和 综合 性 
实验 ) 供 教师 和 学 生 选 用 。 

为 了 便于 学 生 学 习 和 上 机 实验 ,我 们 还 编写 了 与 本 教程 配套 的 数据 结 
构 教程 学 习 指 导 》 和 《数据 结构 教程 上 机 实验 指导 } 两 书 ,构成 一 个 完整 的 教 
学 系列 。 本 系列 教程 中 的 所 有 程序 均 在 Visual C++ 6.0 和 Dev C++ 5 环境 
(程序 文件 为 * .cpp) 下 调试 通过 。 

本 教程 和 配套 的 上 机 实验 指导 ,学 习 指导 的 编写 得 到 武汉 大 学 “ 弘 狼 学 
堂 ”数据 结构 荣誉 课程 教学 项 目 和 湖北 省 “计算 机 科学 与 技术 专业 课程 体系 
改革 ”项 目的 支 助 ,聚集 了 课程 组 许多 教师 多 年 来 在 数据 结构 课程 教学 研究 
和 教学 改革 中 的 经 验 与 成 果 。 本 书 在 编写 过 程 中 得 到 王丽娜 、 黄 传 河和 吴 
黎 兵 等 多 位 教授 ,博导 的 大 力 支持 , 陈 国 良 院士 提供 了 富有 建设 性 的 指导 ， 
很 多 使 用 本 书 的 老师 和 同学 给 予 了 热心 帮助 ,清华 大 学 出 版 社 的 魏 江 江 主 
任 和 王 冰 飞 编辑 给 予 了 愉快 的 合作 ,作者 在 此 一 并 表示 衷心 的 感谢 。 

为 了 方便 教师 教学 和 学 生 学 习 , 本 书 提供 了 全 面 而 丰富 的 教学 资源 ,其 
中 包括 教学 PPT、 教 学 视频 、 源 程序 代码 和 练习 题 参考 答案 等 。 可 以 扫描 封 
底 课 件 二 维 码 免费 下 载 。 

本 书 是 全 视频 教程 ,提供 了 涵盖 所 有 知识 点 的 微 课 视频 ,部 分 视频 提供 
了 更 多 示例 的 讲解 ,附录 E 中 还 包括 2015 年 ~2017 年 全 国 计 算 机 专业 研究 
生 入 学 联 考 数据 结构 部 分 试题 的 讲解 视频 。 

由 于 水 平 所 限 , 尽 管 作者 不 遗 余力 ,本 书 仍 可 能 存在 错误 和 不 足 之 处 ， 
敬 请 读者 批评 指正 ,特别 希望 使 用 本 书 的 教师 与 作者 探讨 ,共同 提高 我 国 计 
算 机 专业 数据 结构 课程 的 教学 水 平 。 


作 者 
2017 年 1 月 
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数据 结构 "是 计算 机 及 相关 专业 的 专业 基础 课 之 一 , 是 一 门 十 
分 重要 的 核心 课程 , 主要 学 习 用 计算 机 实现 数据 组 织 和 数据 处 理 的 
方法 。 它 也 为 计算 机 专业 的 后 续 课 程 ( 如 操作 系统 、 编译 原理 、 数据 
库 原理 和 软件 工程 等 ) 的 学 习 打 下 了 坚实 的 基础 。 

另外 , 随 着 计算 机 应 用 领域 的 不 断 扩大 , 非 数 值 计 算 问 题 占 据 
了 当今 计算 机 应 用 的 绝 大 多 数 , 简单 的 数据 类 型 已 经 远 远 不 能 满足 
需要 , 各 数据 元 素 之 间 的 复杂 联系 已 经 不 是 普通 数学 方程 式 所 能 表 
达 的 了 , 无 论 设计 系统 软件 还 是 应 用 软件 都 会 用 到 各 种 复杂 的 数据 
结构 , 因此 掌握 好 数据 结构 课程 的 知识 对 于 提高 解决 实际 问题 的 能 
力 将 会 有 很 大 的 帮助 。 实 际 上 , 一 个 好 ”的 程序 无 非 是 选择 一 个 
合理 的 数据 结构 和 好 的 算法 , 而 好 的 算法 的 选择 在 很 大 程度 上 取决 
于 描述 实际 问题 所 采用 的 数据 结构 , 所 以 要 想 编写 出 好 ”的 程序 ， 
学 生 仅 仅 学 习 计 算 机 语言 是 不 够 的 , 必须 扎实 地 掌握 数据 结构 的 基 
本 知识 和 基本 技能 。 
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什么 是 数据 结构 。 米 


在 了 解数 据 结构 的 重要 性 之 后 开始 讨论 数据 结构 的 概念 ,本 节 先 给 出 数据 结构 的 严格 
定义 ,再 从 一 个 简单 的 学 生 表 例 子 人 手 , 展 示 数 据 结构 包含 的 三 个 方面 的 内 容 , 接 着 分 析 数 据 
逻辑 结构 和 存储 结构 的 几 种 类 型 ,最 后 给 出 了 数据 类 型 和 抽象 数据 类 型 之 间 的 区 别 与 联系 。 


1.11 数据 结构 的 定义 


用 计算 机 解决 一 个 具体 的 问题 大 致 需要 经 过 以 下 几 个 步骤 : 

(1) 分 析 问 题 , 确 定数 据 模型 。 首 党 

(2) 设计 相应 的 算法 。 视频 讲解 

(3) 编写 程序 ,运行 并 调试 程序 ,直至 得 到 正确 的 结果 。 

寻求 数学 模型 的 实质 是 分 析 问 题 ,从 中 提取 操作 的 对 象 , 并 找 出 这 些 操作 对 象 之 间 的 关 
系 , 然 后 用 数学 语言 加 以 描述 。 有 些 问 题 的 数据 模型 可 以 用 具体 的 数学 方程 等 来 表示 ,但 更 
多 的 实际 问题 是 无 法 用 数学 方程 来 表示 的 ,这 就 需要 从 数据 入 手 来 分 析 并 得 到 解决 问题 的 
方法 。 

数据 (data) 是 描述 客观 事物 的 数 和 字符 的 集合 。 例 如 ,人 们 在 日 常生 活 中 使 用 的 各 种 
文字 ,数字 和 特定 符号 都 是 数据 。 从 计算 机 的 角度 看 ,数据 是 所 有 能 被 输入 到 计算 机 中 , 且 
能 被 计算 机 处 理 的 符号 的 集合 , 它 是 计算 机 操作 的 对 象 的 总 称 ,也 是 计算 机 所 处 理 信 息 的 某 
种 特定 的 符号 表示 形式 (例如 ,200902 班 学 生 数据 就 是 该 班 全 体 学 生 记录 的 集合 )。 

人 们 通常 以 数据 元 素 (data element) 作 为 数据 的 基本 单位 (例如 ,200902 班 中 的 每 个 学 
生 记录 都 是 一 个 数据 元 素 )。 在 有 些 情况 下 ,数据 元 素 也 称 为 元 素 、 结 点 、 顶 点 或 者 记录 等 。 
一 个 数据 元 素 可 以 由 若干 个 数据 项 组 成 。 

数据 项 (data item) 是 具有 独立 含义 的 数据 最 小 单位 ,也 称 为 字段 或 域 。 例 如 ,200902 
班 中 的 每 个 数据 元 素 ( 即 学 生 记录 ) 是 由 学 号 、 姓 名 、 性 别 和 班 号 等 数据 项 组 成 的 。 

数据 对 象 (data object) 是 指 性 质 相 同 的 数据 元 素 的 集合 , 它 是 数据 的 一 个 子 集 。 在 数 
据 结构 课程 中 讨论 的 数据 通常 指 的 是 数据 对 象 。 

数据 结构 (data structure) 是 指 所 有 数据 元 素 以 及 数据 元 素 之 间 的 关系 ,可 以 看 作 是 相 

















互 之 间 存 在 着 某 种 特定 关系 的 数据 元 素 的 集合 ,如 图 1. 1 所 示 。 因 此 ,我 们 可 以 把 数据 结构 
看 成 是 带 结构 的 数据 元 素 的 集合 。 
数据 结构 ”= 数据 + ”结构 数据 结构 通常 包括 以 下 儿 个 方面 。 
® 9 . (1) 数据 的 逻辑 结构 (logical structure) : 由 数据 
ds 8 @ 元 素 之 间 的 逻辑 关系 构成 。 
图 1.1 数据 结构 由 数据 和 结构 组 成 (2) 数据 的 存储 结构 (storage structure) : 数据 元 


素 及 其 关系 在 计算 机 存储 器 中 的 存储 表示 ,也 称 为 数 
据 的 物理 结构 (physical structure) 。 
(3) 数据 的 运算 (operation) : 施加 在 该 数据 上 的 操作 。 
因此 ,数据 结构 是 一 门 讨论 * 描 述 现实 世界 实体 的 数学 模型 (通常 为 非 数值 计算 ) 及 其 之 
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上 的 运算 在 计算 机 中 如 何 表示 和 实现 ”的 学 科 。 

那么 学 习 数据 结构 有 什么 意义 呢 ? 以 盖 一 栋 房屋 为 例 ,如 图 1. 2 所 示 , 房 屋 由 很 多 构件 
组 成 ,如 窗户 就 是 重要 的 构件 。 这 里 可 以 将 窗户 看 成 一 
个 数据 结构 ,窗户 的 元 素 包括 铝 合金 框 、 玻 璃 .拉手 和 滑 
轮 等 ,这 些 元 素 构成 的 窗户 的 模型 就 是 逻辑 结 构 , 其 运算 
包括 它 所 提供 的 各 种 功能 。 若 把 窗户 模型 设计 好 ,在 建 
房屋 时 就 可 以 直接 使 用 它 。 

软件 开发 也 是 如 此 ,如 果 提 炼 出 其 中 的 一 个 个 数据 
结构 ,并 加 以 “好 ”的 设计 ,不 仅 可 以 提高 开发 效率 ,而 且 
会 提高 软件 的 可 靠 性 。 六 二 全 训 


112 逻辑 结构 


数据 的 逻辑 结构 是 从 数据 元 素 的 迎 辑 关系 上 描述 数据 的 ,是 指数 据 元 素 之 间 的 迎 辑 关 
系 的 整体 ,通常 是 从 求解 问题 中 提炼 出 来 的 。 数 据 逻 辑 结构 与 数据 的 存储 无 关 , 是 独立 于 计 
算 机 的 ,因此 数据 的 逻辑 结构 可 以 看 作 是 从 具体 问题 抽象 出 来 的 数学 模型 。 

在 现实 世界 中 ,数据 元 素 的 迎 辑 关系 是 多 种 多 样 的 ,但 在 数据 结构 中 主要 讨论 数据 运算 
之 间 的 相 邻 关系 或 者 邻接 关系 。 


数据 的 逻辑 结构 可 以 采用 多 种 方式 表示 ,常见 的 有 图 表 和 二 元 组 等 。 

1) 图 表 表示 

逻辑 结构 的 图 表 表 示 就 是 采用 表格 或 者 图 形 直接 描述 数据 的 逻辑 关系 。 例 如 ,有 一 个 
学 生 表 ( 数 据 ) 如 表 1. 1 所 示 。 这 个 表 中 的 数据 元 素 是 学 生 记录 ,每 个 数据 元 素 由 4 个 数据 
项 ( 即 学 号 、. 姓 名 .性别 和 班 号 ) 组 成 。 从 逻辑 上 看 ,学 号 1 的 元 素 和 学 号 8 的 元 素 是 相 邻 的 ， 
而 学 号 12 的 元 素 和 学 号 5 的 元 素 是 不 相 邻 的 。 这 7 个 学 生 记 录 和 它们 之 间 的 相 邻 关系 就 
构成 了 该 数据 的 逻辑 结构 。 


























表 1.1 学 生 表 
学 号 姓 名 性 别 班 ”号 
张 研 男 9901 
8 刘 丽 女 9902 
34 李 英 女 9901 
20 陈 华 男 9902 
12 王 奇 男 9901 Wm 
26 董 强 男 9902 
5 王 萍 这 9901 





在 用 图 形 表 示 逮 辑 结构 时 ,图 形 中 的 每 个 结 点 对 应 着 一 个 数据 元 素 ,两 结 点 之 间 带 箭头 
的 连 线 表 示 它 们 之 间 的 相 邻 关系 。 假 设 用 * 学 号 ”数据 项 唯一 标识 数据 元 素 , 学 生 表 的 多 辑 
结构 图 形 表示 如 图 1. 3 所 示 。 
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图 1.3 学 生 表 的 图 形 表示 


2) 二 元 组 表示 
二 元 组 是 一 种 通用 的 数据 逻辑 结构 表示 方式 。 一 个 二 元 组 表示 如 下 : 


B=(D,R) 


其 中 ,B 是 一 种 数据 逻辑 结构 , 它 由 数据 元 素 的 集合 D 以 及 D 上 二 元 关系 的 集合 RR 所 组 
成 。 即 : 


D= {di|l1<i<n,n>0} 
R= {rl1<j<m, m0} 


其 中 ,di 表示 集合 D 中 的 第 i 个 数据 元 素 ,n 为 D 中 数据 元 素 的 个 数 ,车 n= 二 0, 则 D 是 一 个 
空 集 , 因 而 B 也 就 无 结构 可 言 ,有 时 把 这 种 情况 认为 是 具有 任意 结构 。 

方 表示 集合 R 中 的 第 j 个 关系 ,mm 为 R 中 关系 的 个 数 , 若 m= 二 0, 则 R 是 一 个 空 集 ,表明 
集合 D 中 的 数据 元 素 间 不 存在 任何 逻辑 关 系 , 彼 此 是 独立 的 ,这 和 数学 中 集合 的 概念 是 一 
致 的 。 

R 中 的 一 个 关系 x 是 序 偶 的 集合 ,对 于 中 的 任 一 序 偶 <zr,y >(zx,yED), 表 示 元 素 x 
和 > 之 间 是 相 邻 的 , 即 zz 在 y 之 前 ,y 在 zx 之 后 ,zx 称 为 该 序 偶 的 第 一 元 素 ,y 称 为 该 序 偶 的 
第 二 元 素 ,而 且 xz 为 y 的 直接 前 驱 元 素 (predecessor),y 为 x 的 直接 后 继 元 素 (successor)。 
为 了 简便 ,后 面 将 直接 前 驱 元 素 和 直接 后 继 元 素 分 别 简 称 为 前 驱 元 素 和 后 继 元 素 。 

若 某 个 元 素 没有 前 驱 元 素 , 则 称 该 元 素 为 开始 元 素 (first element); 若 某 个 元 素 没 有 后 
继 元 素 , 则 称 该 元 素 为 终端 元 素 (terminal element) 。 

对 于 对 称 序 偶 , 即 <z,y>Er' 则 <y,z>ErCz,yED), 可 用 圆 括号 代替 尖 括 号 , 即 
(zr,y)Er。 在 用 图 形 表 示 好 辑 关 系 时 ,对 称 序 偶 用 不 带 箭头 的 连 线 表示 。 

【 例 1.1】 有 一 个 如 表 1. 2 所 示 的 城市 表 , 假 设 区 号 是 唯一 的 ,给 出 其 逻辑 结构 的 二 元 
组 表示 。 








表 1.2 城市 表 
区 号 城市 名 说 明 
010 Beijing 北京 ,首都 
021 Shanghai 上 海 ,直辖 市 
027 Wuhan 武汉 ,湖北 省 省 会 
029 Xian 西安 ,陕西 省 省 会 
025 Nanjing 南京 ,江苏 省 省 会 





城市 表 中 共有 5 个 记录 ,其 逻辑 结构 的 二 元 组 表示 如 下 。 


City=(D, R) 
D={010,021,027,029,025} 


CAME 络 论 





惟一 本 大 下 
r={<010,021>,<021,027>,<027,029>,<029,025 >} 


客观 世界 中 数据 的 逻辑 结构 是 纷繁 复杂 的 ,归纳 起 来 主要 有 以 下 几 类 。 

1) 集合 

集合 (set) 是 指数 据 元 素 之 间 除 了 “同属 于 一 个 集合 ”的 关系 以 外 别 无 其 他 关系 。 

2) 线性 结构 

线性 结构 (linear structure) 是 指 该 结构 中 的 数据 元 素 之 间 存 在 一 对 一 的 关系 。 其 特点 
是 开始 元 素 和 终端 元 素 都 是 唯一 的 ,除了 开始 元 素 和 终端 元 素 以 外 ,其 余 元 素 都 有 且 仅 有 一 
个 前 驱 元 素 , 有 且 仅 有 一 个 后 继 元 素 。 线 性 表 就 是 一 种 典型 的 线性 结构 。 

例如 ,对 于 前 面 的 学 生 表 数据 ,学 号 1 的 元 素 为 开始 元 素 ,学 号 5 的 元 素 为 终端 元 素 。 
其 余 每 个 数据 元 素 有 且 仅 有 一 个 前 驱 结 点 和 一 个 后 继 结 点 ,因此 它 是 一 种 线性 结构 。 

3) 树 形 结构 

树 形 结构 是 指 该 结构 中 的 数据 元 素 之 间 存 在 一 对 多 的 关系 。 其 特点 是 除了 开始 元 素 以 
外 ,每 个 元 素 有 且 仅 有 一 个 前 驱 元 素 , 除 了 终端 元 素 以 外 ,每 个 元 素 有 一 个 或 多 个 后 继 元 素 。 
二 又 树 就 是 一 种 典型 的 树 形 结构 。 

【 例 1.2】 有 一 种 数据 结构 Bi 二 (D,R) ,其 中 : 

D={a,b,c,d,e,f, g,h,i,j} 


R={ x 
r={<a,b>,<a,c>,<a,d>,<b,e>,<c,f>,<c,g>,<d,h>,<d,i>,<d,j>} 


画 出 其 迎 辑 结构 图 形 表示 ,指出 是 什么 类 型 的 ® 
好 辑 结构 。 
对 应 的 图 形 表示 如 图 1.4 所 示 。 
从 该 例 中 可 以 看 出 ,每 个 结 点 有 且 仅 有 一 个 前 © @ 0 


驱 结 点 ( 除 树 根 结 点 a 以 外 ) ,但 有 多 个 后 继 结 点 ( 树 
叶 结 点 可 看 作 具 有 有 零 个 后 继 结 点 ) ,因此 Bi 是 一 种 (中) ( GO CD GD GD 


树 形 结构 。 图 1.4 Bi 的 逻辑 结构 图 示 
【 例 1.3】 有 一 种 数据 结构 B: 王 CD,R) ,其 中 : 


D=1{48,25,64,57,82,36,75} 
R= {n,r:} 





n={<25,36>,<36,48>,<48,57>,<57,64>,<64,75>,<75,82>} mw 


rs={<48,25>,<48,64>,<64,57>,<64,82>,<25,36>,< 82,75>} 


画 出 其 逻辑 结构 图 形 表 示 ,指出 是 什么 类 型 的 逻辑 结构 。 
对 应 的 图 形 如 图 1.5 所 示 。 其 中 xr,( 对 应 图 中 的 虚线 部 分 ) 为 线性 结构 ,rs( 对 应 图 
中 的 实 线 部 分 ) 为 树 形 结构 ,因此 在 同一 数据 集合 上 可 以 有 多 种 迎 辑 关系 。 





4) 图 形 结构 

图 形 结构 是 指 该 结构 中 的 数据 元 素 之 间 存 在 多 
对 多 的 关系 。 其 特点 是 每 个 元 素 的 前 驱 元 素 和 后 继 
元 素 的 个 数 可 以 是 任意 的 ,因此 图 形 结构 可 能 没有 
开始 元 素 和 终端 元 素 ,也 可 能 有 多 个 开始 元 素 、 多 个 
终端 元 素 。 

树 形 结构 和 图 形 结构 统称 为 非 线性 结构 ,该 结 
构 中 的 元 素 之 间 存 在 一 对 多 或 多 对 多 的 关系 。 由 图 
形 结构 、 树 形 结构 和 线性 结构 的 定义 可 知 , 线 性 结构 
是 树 形 结 构 的 特殊 情况 ,而 树 形 结构 又 是 图 形 结构 的 特殊 情况 。 

【 例 1.4】 有 一 种 数据 结构 B: 王 CD,R) ,其 中 : 





图 1.5 B; 的 逻辑 结构 图 示 


了 ={a,b,c,d,e} 
R=t{r} 
r={ (a,b), (a,c), (b,c), (c,d), (c,e), (d,e) } 


夯 出 其 逻辑 结构 图 形 表 示 , 指 出 是 什么 类 型 的 迎 辑 


结构 。 J 
对 应 的 图 形 表示 如 图 1.6 所 示 。 四 
从 该 例 中 可 以 看 出 ,每 个 结 点 可 以 有 多 个 前 驱 结 点 和 NN 
多 个 后 继 结 点 ,因此 Bs 是 一 种 图 形 结构 。 © (©) 
1.13 存储 结构 图 1.6 Bs 的 逻辑 结构 图 示 


数据 多 辑 结构 在 计算 存储 器 中 的 存储 表示 称 为 数据 的 存储 结构 (也 称 为 “_ 扫 - 昌 
喘 像 ) ,也 就 是 多 辑 结构 在 计算 机 中 的 存储 实现 。 当 把 数据 对 象 存储 到 计算 机 | 盟 
中 时 ,通常 要 求 既 要 存储 逻辑 结构 中 的 每 一 个 数据 元 素 , 又 要 存储 数据 元 素 之 ; 
间 的 逻辑 关系 。 [ 3 

显然 数据 的 存储 结构 是 依赖 于 计算 机 的 。 通 常设 计数 据 的 存储 结构 是 借助 ia 
某 种 计算 机 语言 来 实现 的 ,一 般 只 在 高 级 语言 的 层次 上 讨论 存储 结构 ,这 里 采用 C/C++ 语言 。 

在 实际 应 用 中 ,数据 的 存储 方法 是 灵活 多 样 的 ,归纳 起 来 ,数据 结构 中 有 以 下 4 种 常用 
的 存储 结构 类 型 。 


顺序 存储 结构 (sequential storage structure) 是 采用 一 组 连续 的 存储 单元 存放 所 有 的 数 
据 元 素 , 也 就 是 说 ,所 有 数据 元 素 在 存储 器 中 占有 一 整 块 存储 空间 ,而 且 两 个 逻辑 上 相 邻 的 
元 素 在 存储 器 中 的 存储 位 置 也 相 邻 。 因 此 ,数据 元 素 之 间 的 逻辑 关系 由 存储 单元 地 址 间 的 
关系 隐 含 表示 , 即 顺序 存储 结构 将 数据 的 多 辑 结构 直接 映射 到 存储 结构 。 

顺序 存储 结构 的 主要 优点 是 存储 效率 高 ,因为 分 配给 数据 的 存储 单元 全 用 于 存放 数据 
元 素 ,元 素 之 间 的 逻辑 关系 没有 占用 额外 的 存储 空间 ; 另外 ,在 采用 这 种 存储 方法 时 可 实现 
对 元 素 的 随机 存 取 , 即 每 个 元 素 对 应 一 个 逻辑 序号 ,由 该 序号 可 直接 计算 出 对 应 元 素 的 存储 
地 址 ,从 而 获取 元 素 值 。 顺 序 存储 结构 的 主要 缺点 是 不 便于 数据 修改 ,对 元 素 的 插入 或 删除 
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操作 可 能 需要 移动 一 系列 的 元 素 。 
例如 ,对 应 表 1. 1 的 学 生 表 , 可 以 采用 C/C++ 语言 中 的 结构 体 数 组 来 存储 ,设计 对 应 的 
结构 体 数组 Stud 并 初始 化 的 过 程 如 下 : 


struct 


{ intno; // 存 储 学 号 
char name[8] ; // 存 储 姓 名 
char sex[2] ; // 存 储 性 别 
char class[4] ; // 存 储 班 号 


} Stnd[7] = 二 {{1," 张 惰 "," 男 ","9901"}, .…, {5," 王 萍 "," 女 ","9901")}; 


其 中 ,数组 名 称 Stud 作为 数组 的 起 始 地 址 ,用 于 唯一 标识 该 存储 结构 ,如 图 1.7 所 示 。 在 
Stud 数组 中 各 元 素 在 内 存 中 顺序 存放 , 即 Stud[ 让 存放 在 Stud[i 十 1] 之 前 ,而 Stud[i 十 1] 存 
放 在 Stud[ 门 之 后 ,所 以 Stud 是 学 生 表 的 一 种 顺序 存储 结构 。 


Stud[0] Stud[1] Stud[6] 
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Stud: 起 始 地 址 
图 1.7 学 生 表 的 顺序 存储 结构 


在 链 式 存储 结构 (linked storage structure) 中 ,每 个 逻辑 元 素 用 一 个 内 存 结 点 存储 ,每 
个 结 点 是 单独 分 配 的 ,所 有 的 结 点 地 址 不 一 定 是 连续 的 ,所 以 无 须 占 用 一 整 块 存储 空间 。 为 
了 表示 元 素 之 间 的 逻辑 关系 ,给 每 个 结 点 附加 指针 域 , 用 于 存放 相 邻 结 点 的 存储 地 址 ,也 就 
是 通过 指针 域 将 所 有 结 点 链接 起 来 ,这 就 是 链 式 存 储 结 构 名 称 的 由 来 。 

链 式 存储 结构 的 主要 优点 是 便于 数据 修改 ,在 对 元 素 进行 插入 或 删除 操作 时 仅 需 修改 
相应 结 点 的 指针 域 , 不 必 移 动 结 点 。 与 顺序 存储 结构 相 比 , 链 式 存 储 结构 的 主要 缺点 是 存储 
空间 的 利用 率 较 低 ,因为 分 配给 元 素 的 存储 单元 有 一 部 分 被 用 来 存储 结 点 之 间 的 多 辑 关系 ; 
另外 ,由 于 逻辑 上 相 邻 的 元 素 在 存储 空间 中 不 一 定 相 邻 ,所 以 不 能 对 元 素 进行 随机 存 取 。 

例如 ,对 应 表 1. 1 的 学 生 表 ,可 以 采用 C/C++ 语言 中 的 链表 来 存储 ,设计 存放 每 个 元 素 
的 结 点 类 型 StudType 如 下 : 





typedef struct Studnode 





{ int no; // 存 储 学 号 
char name[8] ; // 存 储 姓 名 
char sex[2] ; // 存 储 性 别 ~ 
char class[4] ; // 存 储 班 号 
struct Studnode * next; // 存 储 指向 下 一 个 学 生 结 点 的 指针 
} StudType; // 结 点 类 型 


学 生 表 中 的 每 个 学 生 记 录 采 用 一 个 StudType 类 型 的 结 点 单独 存储 ,一 个 学 生 结 点 的 
next 域 指 向 逻辑 结构 中 它 的 后 继 学 生 记录 对 应 的 结 点 ,从 而 构成 一 个 链表 ,其 存储 结构 如 
图 1.8 所 示 , 首 结 点 的 指针 为 head, 用 它 来 标识 整个 学 生 链 表 , 尾 结 点 的 指针 域 为 空 。 
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二 5 | 王 萍 | 女 | 9901 和 
图 1.8 学 生 表 的 链表 存储 结构 





由 head 所 指 结 点 的 next 域 得 到 下 一 个 结 点 的 地 址 ,然后 再 由 它 得 到 下 一 个 结 点 的 地 
址 …… 这 样 就 可 以 找到 任何 一 个 结 点 的 地 址 ,所 以 head 标识 的 链表 是 学 生 表 的 一 种 链 式 存 
储 结构 。 

索引 存储 结构 (indexed storage structure) 是 指 在 存储 数据 元 素 信息 的 同时 还 建立 附加 
的 索引 表 。 存 储 所 有 数据 元 素 信息 的 表 称 为 主 数据 表 , 其 中 每 个 数据 元 素 有 一 个 关键 字 和 
对 应 的 存储 地 址 。 

索引 表 中 的 每 一 项 称 为 索引 项 ,索引 项 的 一 般 形式 为 “关键 字 , 地 址 ”, 其 中 “关键 字 ” 唯 
一 标识 一 个 元 素 ,“ 地 址 ?对 应 该 关键 字 的 元 素 在 主 数据 表 中 的 存储 地 址 。 通 常 ,索引 表 中 的 
所 有 索引 项 是 按 关键 字 有 序 排列 的 。 

在 按 关键 字 查 找 时 ,首先 在 索引 表 中 利用 关键 字 的 有 序 性 快速 查找 到 该 关键 字 的 地 址 ， 
然后 通过 该 地 址 在 主 数据 表 中 找到 对 应 的 元 素 。 

索引 存储 结构 的 优点 是 查找 效率 高 。 其 缺点 是 需要 建立 索引 表 , 从 而 增加 了 空间 开销 。 

于 

哈 希 (或 散 列 ) 存 储 结构 (hashed storage structure) 的 基本 思想 是 根据 元 素 的 关键 字 通 
过 喻 希 ( 或 散 列 ) 函 数 直 接 计 算出 一 个 值 ,并 将 这 个 值 作为 该 元 素 的 存储 地 址 。 

哈 希 存储 结构 的 优点 是 查找 速度 快 , 只 要 给 出 待 查 元 素 的 关键 字 就 可 立即 计算 出 该 元 
素 的 存储 地 址 。 与 前 3 种 存储 方法 不 同 的 是 , 哈 希 存储 方法 只 存储 元 素 的 数据 ,不 存储 元 素 
之 间 的 逻辑 关系 。 哈 希 存储 结构 一 般 只 适合 要 求 对 数据 能 够 进行 快速 查找 和 插入 的 场合 。 

上 述 4 种 基本 的 存储 方法 既 可 以 单独 使 用 ,也 可 以 组 合 使 用 。 同 一 种 逻辑 结构 采用 不 
同 的 存储 方法 可 以 得 到 不 同 的 存储 结构 。 选 择 何 种 存储 结构 来 表示 相应 的 ， 
逻辑 结构 视 具体 要 求 而 定 , 主 要 考虑 的 是 运算 方便 及 算法 的 时 空 要 求 。 sph 
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算 , 最 常用 的 运算 有 检索 .插入 、 删 除 、 更 新 和 排序 等 。 数 据 运算 最 终 需要 在 对 应 的 存储 结构 
上 用 算法 实现 ,所 以 数据 运算 分 为 运算 定义 和 运算 实现 两 个 层面 。 

运算 定义 是 运算 切 能 的 描述 ,是 抽象 的 ,是 基于 逻辑 结构 的 。 运 算 实现 是 程序 员 完成 运 
算 的 实现 算法 ,是 具体 的 ,是 基于 存储 结构 的 。 这 种 将 运算 定义 和 运算 实现 相互 分 离 的 做 法 
体现 了 软件 工程 的 思想 ,更 加 便于 软件 开发 。 

逻辑 结构 存储 结构 和 运算 三 者 之 间 的 关系 如 图 1. 9 所 示 。 

对 于 学 生 表 这 种 数据 结构 可 以 进行 一 系列 
的 运算 ,例如 查找 逻辑 序号 为 2 的 学 生 的 姓名 、 
插入 一 个 学 生 记 录 和 删除 一 个 学 生 记录 等 。 

以 “查找 逻辑 序号 为 2 的 学 生 的 姓名 "运算 
定义 为 例 , 其 运算 实现 有 以 下 两 种 方式 。 

如 果 采 用 顺序 存储 结构 一 -Stud 数组 ,由 
于 逻辑 序号 为 2 的 学 生 记 录 存 储 在 Stud[1] 数 组 图 1.9 逻辑 结构 \ 存 储 结构 和 运算 
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元 素 中 ,可 以 直接 找到 Stud[1], 通 过 Stud[1] 之 间 的 关系 
. name 返回 其 姓名 , 即 “ 刘 丽 ”。 
如 果 采 用 链 式 存储 结构 一 一 head 链表 ,需要 遍历 该 链表 ,用 字 记 录 查 找 结 点 的 逻辑 序 





号 ,p 二 head 首先 指向 首 结 点 ,i 二 1。 由 于 i 关 2,p 王 p 一 > next 移 到 下 一 个 结 点 ,同时 i 增 1 
变 为 2。 此 时 i 二 2,p 指向 的 结 点 就 是 要 找 的 结 点 ,返回 p 一 > name, 即 * 刘 丽 ”。 

从 中 可 以 看 出 ,对 于 一 种 数据 结构 ,其 逻辑 结构 总 是 唯一 的 ,但 它 可 能 对 应 多 种 存储 结 
构 , 并 且 在 不 同 的 存储 结构 中 同一 运算 的 实现 过 程 可 能 不 同 。 
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数据 类 型 和 抽象 数据 类 型 是 与 数据 结构 密切 相关 的 两 个 概念 ,容易 引 扫 -- 扫 
起 混淆 。 本 节 介绍 这 两 个 概念 。 

在 用 C/C++ 语言 编写 的 程序 中 必须 对 出 现 的 每 个 变量 、 常 量 或 表达 式 
明确 地 说 明 它们 所 属 的 数据 类 型 。 

不 同 数 据 类 型 的 变量 ,其 取 值 范围 和 所 能 进行 的 运算 可 能 不 同 。 例 如 ,C/C++ 语言 有 一 
个 int 数据 类 型 , 它 的 取 值 范围 为 一 32 768 一 32 767(16 位 系统 ) ,可 用 的 运算 有 十 、 一 、x 、/ 
和 % 等 。 所 以 ,以 下 语句 是 正确 的 : 




















inti= 2 = 5,k; 


k = ij; 

而 以 下 语句 是 不 正确 的 : 
int i 一 999999999; //int 类 型 的 数据 取 值 超 界 
xx //int 类 型 不 存在 该 运算 符 


所 以 ,数据 类 型 (data type) 是 一 组 性 质 相 同 的 值 的 集合 和 定义 在 此 集合 上 的 一 组 操作 的 总 
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称 , 是 某 种 程序 设计 语言 中 已 实现 的 数据 结构 。 在 程序 设计 语言 提供 的 数据 类 型 的 支持 下 ， 
就 可 以 根据 从 问题 中 抽象 出 来 的 各 种 数据 模型 逐步 构造 出 描述 这 些 数 据 模型 的 各 种 新 的 数 
据 结构 。 

1) C/C++ 语言 中 常用 的 数据 类 型 

C/C++ 语言 的 数据 类 型 按照 取 值 的 不 同 分 为 原子 类 型 和 结构 类 型 。 原 子 类 型 是 不 可 以 
再 分 解 的 基本 类 型 ; 结构 类 型 是 由 若干 数据 类 型 组 合 而 成 的 ,是 可 以 再 分 解 的 ,如 数组 、 结 
构 体 等 。 下 面 对 C/C++ 语言 中 常用 的 数据 类 型 进行 总 结 。 

(1) C/C++ 语言 中 的 基本 数据 类 型 。 

C/C++ 语言 中 的 基本 数据 类 型 有 int 型 、bool 型 (布尔 型 )、float 型 .double 型 和 char 
型 。int 型 可 以 有 3 个 修饰 符 , 即 short( 短 整数 ) long( 长 整数 ) 和 unsigned( 无 符号 整数 ) 。 

数据 类 型 是 用 来 定义 变量 的 ,例如 有 定义 语句 : 


int n=10; 


在 执行 该 语句 时 ,系统 自动 为 变量 n 在 计算 机 存储 器 
中 分 配 一 个 固定 长 度 ( 如 4 个 字 节 ) 的 存储 空间 ,如 图 1. 10 
所 示 ,程序 员 可 以 通过 变量 名 n 对 这 个 内 存 空 间 进行 存 取 
操作 , 当 超 出 其 作用 范围 时 系统 自动 释放 其 内 存 空 间 , 所 " 
以 称 之 为 自动 变量 (automatic variable) 。 
(2) C/C++ 语言 中 的 指针 类 型 。 图 1.10 为 变量 分 配 存储 空间 
C/C++ 语言 允许 直接 对 存放 变量 的 地 址 进行 操作 。 
例如 ,有 以 下 定义 : 








int i, * p; 


其 中 ,i 是 整 型 变量 ,p 是 指针 变量 ( 它 用 于 存放 某 个 整 型 变量 的 地 址 )。 表 达 式 &i 表示 变 
量 i 的 地 址 ,将 p 指向 整 型 变量 i 的 运算 为 p 二 &i。 
对 于 指针 变量 p ,表达 式 * p 是 取 p 所 指 变量 的 值 ,例如 : 


int i=2, * p= &i; 
printf("% d\n", * p); 


上 述 语句 执行 后 ,其 内 存 结构 如 图 1. 11 所 示 , 通 过 *p 输出 变量 i 的 值 , 即 2。 
(3) C/C++ 语言 中 的 数组 类 型 。 

2 数组 是 同一 数据 类 型 的 一 组 数据 元 素 的 集合 ,在 C/C++ 语 
言 中 定义 数组 时 需要 指定 数组 大 小 , 即 数组 中 存放 的 最 多 元 素 
个 数 。 数 组 分 为 一 维 数组 和 多 维 数组 等 。 数 组 名 用 于 标识 一 个 
数组 ,下 标 指 示 一 个 数组 元 素 在 该 数组 中 的 位 置 。 

数组 下 标的 最 小 值 称 为 下 界 ,在 C/C++ 语言 中 总 是 为 0。 数 组 下 标的 最 大 值 称 为 上 界 ， 
在 C/C++ 语言 中 数组 上 界 为 数组 的 大 小 减 1。 例 如 ,int a[10] 定 义 了 包含 10 个 整数 的 数组 
a, 数 组 元 素 为 cL0] 一 a[9]。 


i 





p| 一 -| 




















1.11 指针 变量 指向 
整 型 变量 i 
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(4) C/C++ 语言 中 的 结构 体 类 型 。 

结构 体 类 型 是 由 一 组 被 称 为 结构 体 成 员 的 数据 项 组 成 的 ,每 个 结构 体 成 员 都 有 自己 的 
标识 符 , 也 称 为 数据 域 。 一 个 结构 体 类 型 中 所 有 成 员 的 数据 类 型 可 以 不 相同 。 例 如 ,以 下 声 
明了 一 个 Teacher 结构 体 类 型 : 


struct Teacher // 教 师 结构 体 类 型 

{ intno; // 成 员 编号 , 占 4 个 字 节 
char name[8] ; // 成 员 姓名 , 占 8 个 字 节 
int age; // 成 员 年 龄 , 占 4 个 字 节 


}; 
以 下 语句 定义 了 结构 体 类 型 Teacher 的 一 个 结构 体 变 量 : 并 赋值 : 


struct Teacher t; 








t.no=85; 

strcpy(t.name, " 张 敏 "); 

t.age= 42; 

结构 体 变量 : 在 内 存 中 的 存放 方式 如 图 1. 12 所 示 ， + 匡 训 人 
引用 no 成 员 的 方式 是 t. no, 引 用 name 成 员 的 方式 是 3 张 敏 林 
t. name, 引 用 age 成 员 的 方式 是 t. age, 所 有 成 员 相 邻 存 lh i age 
放 。z 变量 所 分 配 的 内 存 空间 大 小 为 所 有 成 员 占 用 的 内 图 1.12 结构 体 变量 :在 内 存 中 的 
存 空间 之 和 。 


存放 方式 
(5) C/C++ 语言 中 的 共用 体 类 型 。 


共用 体 是 把 不 同 的 成 员 组 织 为 一 个 整体 ,它们 在 内 存 中 共享 一 段 存储 单元 ,但 不 同 成 员 
以 不 同 的 方式 被 解释 。 例 如 ,声明 一 个 共用 体 类 型 Tag 如 下 : 


union Tag //Tag 共用 体 
{ short int n; // 成 员 n, 占 两 个 字 节 
char ch[2] ; // 成 员 ch 数组 , 占 两 个 字 节 


}; 
以 下 语句 定义 了 共用 体 类 型 Tag 的 一 个 共用 体 变 量 u 并 赋值 : 


union Tag u; 


u.n 一 0x4142; // 若 为 u 二 0x4142; 这 种 直接 赋值 是 错误 的 


共用 体 变 量 在 内 存 中 的 存放 方式 如 图 1. 13 所 示 , 引 用 成 员 的 方式 是 wu.n, 引 用 ch 
成 员 的 ch[L0] 元 素 的 方式 是 u. ch[0],n 和 ch 成 员 共 享 相 


" jy 同 的 内 存 空间 。w 变量 所 分 配 的 内 存 空间 大 小 为 所 有 成 
oj 员 占 用 空间 的 最 大 值 。 





sh。 chlo] (6) C 语言 中 的 自 定义 类 型 。 
1.13 ”共用 体 变量 w 在 内 存 中 C/C++ 语言 中 允许 使 用 typedef 关键 字 来 指定 一 个 
的 存放 方式 新 的 数据 类 型 名 ,例如 : 





aa 
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typedef char ElemType; 


将 char 类 型 与 ElemType 等 同 起 来 ,特别 是 将 代码 较 长 的 结构 体 类 型 声明 用 自 定义 类 
型 标识 符 来 代 蔡 ,这样 可 以 简化 代码 。 例 如 : 


typedef struct Student //Student 结构 体 类 型 
{int no; // 学 号 成 员 
char name[10] ; // 姓 名 成 员 
char sex; // 性 别 成 员 
int cno; // 班 号 成 员 
} NewType; // 用 NewType 别名 表示 Student 结构 体 类 型 


这 样 ,NewType 等 同 于 Student 结构 体 类 型 ,可 以 使 用 该 类 型 定义 变量 : 


NewType s1,s2; 


等 同 于 : 


struct Student sl], s2; 


2) 存储 空间 的 分 配 

在 程序 设计 中 ,定义 变量 就 是 使 用 内 存 空 间 ,而 存储 空间 的 分 配 主要 有 两 种 方式 。 

(1) 静态 存储 空间 分 配方 式 。 

所 谓 静 态 存储 空间 分 配方 式 是 指 在 程序 编译 期 间 分 配 固定 的 存储 空间 的 方式 。 该 存储 
分 配方 式 通常 是 在 变量 定义 时 就 分 配 存储 单元 并 一 直 保持 不 变 ,直至 整个 程序 结束 。 以 定 
义 一 个 数组 为 例 ,如 下 语句 就 采用 了 这 种 方式 : 


int a[10] ; 


一 旦 遇 到 该 语句 ,系统 就 为 数组 分 配 10 个 int 整数 空间 。 无 论 程序 是 否 向 w 中 放 入 
元 素 , 这 一 片 空 间 都 被 占用 。 它 也 属于 自动 变量 , 当 超出 其 作用 范围 时 系统 自动 释放 其 内 存 
空间 。 

(2) 动态 存储 空间 分 配方 式 。 

所 谓 动 态 存 储 空间 分 配方 式 是 指 在 程序 运行 期 间 根 据 需 要 动态 地 分 配 存储 空间 的 方 
式 。C/C++ 语 言 提供 了 一 套 机 制 可 以 在 程序 执行 时 动态 分 配 存储 空间 ,如 malloc()/free() 
函数 对 。 即 使 用 malloc() 函数 为 一 个 指针 变量 (如 pp 指针) 分配 一 片 连续 的 空间 , 当 不 再 需 
要 时 使 用 free() 函 数 释放 p 所 指向 的 空间 。 例 如 : 


char *p; 

p= (char * )malloc(10 * sizeof(char)); // 动 态 分 配 10 个 连续 的 字符 空间 
strcpy(p, "China"); // 将 "China" 存 放 到 p 所 指向 的 空间 中 
Printf("% ce\n", * p); // 输 出 字符 C 

printf(" % s\n", p); // 输 出 字符 串 "China”" 

free(p); // 释 放 p 所 指向 的 空间 
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上 述 代码 先 定义 一 个 字符 指针 变量 p, 然 后 使 用 malloc() 函数 为 其 分 配 长 度 为 10 个 字 
符 的 存储 空间 ,将 该 存储 空间 的 首 地 址 赋 给 p, 再 将 字符 串 "China" 放 到 这 个 存储 空间 中 ,如 
图 1.14 所 示 。 所 以 第 1 个 printf 语句 输出 的 是 首 地 址 的 字符 , 即 'C', 而 第 2 个 printf 语句 
输出 的 是 整个 字符 串 , 即 "China"。 


转换 为 字符 指针 ”分配 的 字符 个 数 

















\ | p 10 个 字符 空间 
p-(char “jmalloc(10*sizeof(char)): SS [J chinad 
TT 

Pp 为 指针 变量 求 每 个 字符 占用 的 空间 大 小 Pp 变量 空间 pp 所 指向 的 空间 


图 1.14 为 指针 变量 p 分 配 指 向 的 空间 


注意 : 在 上 述 代码 中 ,指针 变量 pp 属于 自动 变量 , 它 自 身 的 存储 空间 由 系统 自动 分 配 和 
释放 ,但 用 malloc() 函 数 分 配 的 存储 空间 (也 就 是 p 指向 的 存储 空间 ) 不 会 被 系统 自动 释 
放 , 所 以 最 后 需要 加 上 free(p) 语 名 用 于 释放 p 所 指向 的 存储 空间 。 

这 种 动态 存储 空间 分 配方 式 的 优点 是 不 需要 预先 分 配 存 储 空间 ,分 配 的 空间 可 以 根据 
程序 的 需要 扩大 或 缩小 ,如 链 式 存储 结构 通常 采用 动态 存储 空间 分 配方 式 。 其 缺点 是 需要 
程序 员 简 单 地 管理 内 存 空间 ,也 就 是 用 malloc() 函数 动态 分 配 的 空间 ,在 后 面 一 定 要 用 free() 
函数 释放 ,否则 动态 分 配 的 空间 对 于 程序 而 言 就 丢失 了 ,久而久之 可 能 会 造成 内 存 泄露 。 


抽象 数据 类 型 (Abstract Data Type,ADT) 指 的 是 用 户 进 行 软 件 系统 设计 时 从 问题 的 
数学 模型 中 抽象 出 来 的 逻辑 数据 结构 和 逻辑 数据 结构 上 的 运算 ,而 不 考虑 计算 机 的 具体 存 
储 结 构 和 运算 的 具体 实现 算法 。 抽象 数 据 类 型 中 的 数据 对 象 和 数据 运算 的 声明 与 数据 对 象 
的 表示 和 数据 运算 的 实现 相互 分 离 。 

一 个 具体 问题 的 抽象 数据 类 型 的 定义 通常 采用 简洁 、 严 并 的 文字 描述 ,一 般 包括 数据 对 
象 ( 即 数据 元 素 的 集合 )、 数 据 关系 和 基本 运算 三 方面 的 内 容 。 一 个 抽象 数据 类 型 可 用 
(D,S,P) 三 元 组 表示 。 其 中 ,D 是 数据 对 象 ,S 是 D 上 的 关系 集 ,P 是 D 中 数据 运算 的 基本 

抽象 数据 类 型 的 基本 描述 格式 如 下 : 


ADT 抽象 数据 类 型 名 

{ ”数据 对 象 : 数据 对 象 的 声明 
数据 关系 : 数据 关系 的 声明 
基本 运算 : 基本 运算 的 声明 





} aa 


其 中 ,基本 运算 的 声明 格式 为 
基本 运算 名 (参数 表 ) : 运算 功能 描述 


基本 运算 有 两 种 参数 ,其 中 值 参数 只 为 运算 提供 输入 值 , 引 用 参数 以 & 打头 ,除了 可 提 
供 输入 值 以 外 ,还 将 返回 运算 结果 。 
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例如 ,一 个 复数 的 抽象 数据 类 型 Complex 的 定义 如 下 : 


ADT Complex 
{ ”数据 对 象 : 
DD 二 {e1,e: | el ez 均 为 实数 } // 一 个 复数 由 e 和 ez: 两 个 实数 构成 
数据 关系 : 
R= 二 {<e1,ez > | el 是 复数 的 实数 部 分 ,ez 是 复数 的 虚数 部 分 } 
//e 和 ez 在 复数 中 的 逻辑 关系 是 < e1 ,ez > 
基本 运算 : 
AssignComplex( &z, v1,v2) : 构造 复数 x, 其 实 部 和 虚 部 分 别 为 参数 1 和 v2 的 值 。 
DestroyComplex( &z) : 销毁 复数 =。 
GetReal(z, &real): 用 real 返回 复数 z 的 实 部 值 。 
GetImag(z, &imag): 用 imag 返回 复数 = 的 虚 部 值 。 
Add(z1,z2, 及 sum): 用 sum 返回 两 个 复数 z1、z2 相 加 的 结果 。 
} 


抽象 数据 类 型 有 两 个 重要 特征 , 即 数据 抽象 和 数据 封装 。 所 谓 数据 抽象 ,是 指 用 ADT 
描述 程序 处 理 的 实体 时 强调 的 是 其 本 质 的 特征 、 其 所 能 完成 的 功能 以 及 它 和 外 部 用 户 的 接 
口 ( 即 外 界 使 用 它 的 方法 ) 。 所 谓 数据 封装 ,是 指 将 实体 的 外 部 特性 和 其 内 部 实现 细节 分 离 ， 
并 且 对 外 部 用 户 隐藏 其 内 部 实现 细节 。 

从 数据 结构 的 角度 看 ,一 个 求解 问题 可 以 通过 抽象 数据 类 型 来 描述 ,也 就 是 说 ,抽象 数 
据 类 型 对 一 个 求解 问题 从 逻辑 上 进行 了 准确 的 定义 ,所 以 抽象 数据 类 型 由 数据 馆 辑 结构 和 
运算 定义 两 部 分 组 成 。 抽 象 意味 着 一 个 抽象 数据 类 型 可 能 有 多 种 实现 方式 ,ADT 和 ADT 
的 实现 如 图 1. 15 所 示 。 抽 象 数据 类 型 需要 通过 固有 数据 类 型 (高 级 编程 语言 中 已 实现 的 数 








据 类 型 ) 来 实现 。 
ADT ADT 的 实现 
1.15 ADT 和 ADT 的 实现 
> :不 RU 
pe 算法 及 其 描述 ZIS 


本 节 先 给 出 算法 的 定义 ,算法 特性 和 算法 设计 的 目标 ,然后 讨论 算法 的 
描述 方法 。 


121 什么 是 算法 
算法 (algorithm) 是 对 特定 问题 求解 步骤 的 一 种 描述 . 它 是 指令 的 有 限 
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序列 。 其 中 每 一 条 指令 表示 计算 机 的 一 个 或 多 个 操作 。 例 如 ,以 下 是 求解 两 个 正 整 数 mx 和 
n 的 最 大 公约 数 的 算法 : 

(1) r=m mod n。 

(2) 若 r 二 0, 输 出 最 大 公约 数 ,算法 结束 。 

(3) 车 7 关 0, 令 mm 二 n,n 二 r, 转 (1) 继 续 。 

一 个 算法 应 该 具有 以 下 5 个 重要 的 特性 。 

(1) 有 穷 性 ; 一 个 算法 必须 总 是 (对 任何 合法 的 输入 值 ) 在 执行 有 穷 步 之 后 结束 , 且 每 
一 步 都 可 在 有 穷 时 间 内 完成 。 任 何不 会 终止 的 算法 都 是 没有 意义 的 。 

(2) 确定 性 : 对 于 每 种 情况 下 执行 的 操作 在 算法 中 都 有 确切 的 规定 ,使 算法 的 执行 者 
或 阅读 者 都 能 明确 其 含义 及 如 何 执行 ,并 且 在 任何 条 件 下 算法 都 只 有 一 条 执行 路 径 , 即 对 于 
相同 的 输入 只 能 得 出 相同 的 输出 ,不 能 有 二 义 性 。 

(3) 可 行 性 : 算法 中 的 所 有 操作 都 必须 足够 基本 ,算法 可 以 通过 有 限 次 基本 操作 来 完 
成 其 功能 ,也 就 是 说 算法 中 的 每 一 个 动作 能 够 被 机 械 地 执行 。 像 前 面 求 最 大 公约 数 的 算法 
中 ,每 一 个 操作 都 是 基本 操作 ,都 可 以 用 纸 和 笔 在 有 限时 间 内 完成 。 

(4) 有 输入 : 作为 算法 加 工 对 象 的 量 值 ,通常 体现 为 算法 中 的 一 组 变量 。 一 个 算法 有 
零 个 或 者 多 个 输入 。 

(5) 有 输出 : 一 组 与 “输入 ”有 确定 对 应 关系 的 量 值 ,是 算法 进行 信息 加 工 后 得 到 的 结 
果 , 这 种 确定 关系 即 为 算法 的 功能 。 一 个 算法 有 一 个 或 者 多 个 输出 。 

说 明 : 算法 和 程序 是 有 区 别 的 ,程序 是 指使 用 某 种 计算 机 语言 对 一 个 算法 的 具体 实现 ， 
即 具体 要 怎么 做 ,而 算法 侧重 于 对 解决 问题 的 方法 描述 , 即 要 做 什么 。 算 法 必须 满足 有 穷 
性 ,而 程序 不 一 定 满足 有 穷 性 ,如 Windows 操作 系统 在 用 户 没有 退出 硬件 不 出 现 故 障 以 及 
不 断 电 的 条 件 下 理论 上 可 以 无 限时 运行 ,所 以 严格 地 讲 算法 和 程序 是 两 个 不 同 的 概念 。 当 
然 , 算 法 也 可 以 直接 用 计算 机 程序 来 描述 ,这 样 算法 和 程序 就 是 一 回 事 了 ,本 书 就 是 采用 这 
种 方式 。 
1.22 算法 设计 的 目标 

算法 设计 应 满足 以 下 几 个 目标 。 

(1) 正确 性 : 要 求 算法 能 够 正确 地 执行 预先 规定 的 功能 和 性 能 要 求 。 
这 是 最 重要 也 是 最 基本 的 标准 。 

(2) 可 使 用 性 : 要 求 算法 能 够 很 方便 地 使 用 。 这 个 特性 也 叫 用 户 友 好 性 。 

(3) 可 读 性 : 算法 应 该 易于 使 人 理解 ,也 就 是 可 读 性 好 。 为 了 达到 这 个 要 求 ,算法 的 逻 











辑 必须 是 清晰 的 、 简 单 的 和 结构 化 的 。 ~ 


(4) 健壮 性 : 要 求 算法 具有 很 好 的 容错 性 , 即 提供 异常 处 理 , 能 够 对 不 合理 的 数据 进行 
检查 ,不 经 常 出 现 异常 中 断 或 死机 现象 。 

(5) 高 效率 与 低 存储 量 需求 : 通常 算法 的 效率 主要 指 算法 的 执行 时 间 。 对 于 同一 个 问 
题 ,如 果 有 多 种 算法 可 以 求解 ,执行 时 间 短 的 算法 效率 高 。 算 法 存储 量 指 的 是 算法 执行 过 程 
中 所 需 的 最 大 存储 空间 。 效 率 和 存储 量 都 与 问题 的 规模 有 关 。 
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123 算法 描述 


描述 算法 的 方式 很 多 ,有 的 采用 类 Pascal 语言 ,有 的 采用 自然 语言 伪 码 、 流 程 图 或 者 表 
格 方式 等 ,但 对 于 计算 机 专业 的 学 生 应 该 熟练 使 用 计算 机 语言 来 描述 算法 。 本 书 采用 
C/C++ 语言 来 描述 算法 。 

二 





通常 用 C/C++ 函数 来 描述 算法 。 算 法 描述 的 一 般 格式 如 下 : 








返回 值 算法 对 应 的 函数 名 ( 形 参 列表 ) 
{ ”临时 变量 的 定义 
实现 由 输入 参数 到 输出 参数 的 操作 。” 函数 体 














视频 讲解 
其 中 ,“ 返 回 值 ” 通 常 为 bool 类 型 ,表示 算法 是 否 成 功 执 行 ;“ 形 参 列表 ”表示 算法 的 参数 ,由 
于 算法 包含 输入 和 输出 ,所 以 形 参 列表 由 输入 型 参数 和 输出 型 参数 构成 ; 函数 体 实现 算法 
的 功能 。 

一 个 算法 通常 完成 某 个 单一 的 功能 ,算法 设计 的 一 般 步骤 如 下 : 

(1) 分 析 算 法 的 功能 。 

(2) 确定 算法 有 哪些 输入 ,将 这 些 输入 设计 成 输入 型 参数 ; 确定 算法 有 哪些 输出 ,将 这 
些 输 出 设计 成 输出 型 参数 。 

(3) 设计 函数 体 , 完 成 从 输入 到 输出 的 操作 过 程 。 

在 设计 算法 时 ,输入 型 参数 的 设计 是 十 分 简单 的 ,那么 输出 型 参数 如 何 设计 呢 ? 下 面 通 
过 一 个 示例 进行 说 明 。 

例如 设计 一 个 交换 两 个 整数 的 算法 ,编写 相应 的 函数 swapl1(z,y) 如 下 : 


void swapl(int x,int y) 
{ int tmp; 

tmp™— x? ZY: y= tp 
} 


在 该 函数 中 的 确实 现 了 两 个 形 参 x 和 y 的 值 交换 ,但 调用 该 算法 (也 就 是 执行 语句 
swapl(a,b)) 时 发 现 a 和 2 实 参 值 并 不 会 发 生 交 换 。 出 现 错误 的 原因 是 这 里 的 形 参 r、y 既 
是 输入 型 参数 ,也 是 输出 型 参数 ,而 swap1(z,y) 中 仅仅 将 形 参 zx、y 作为 输入 型 参数 设计 。 

改正 方法 1: 采用 指针 的 方式 来 回 传 形 参 的 值 ,将 上 述 函 数 改 为 如 下 。 





void swap2(int * x,int *y) 


{ inttmp; 
tmp= * x; // 将 x 所 指 的 值 放 在 tmp 中 
Es // 将 x 所 指 的 值 改 为 y 所 指 的 值 
x* y= tmp; // 将 y 所 指 的 值 改 为 tmp 


这 样 调用 该 函数 的 方式 改 为 swap2(&a,&0) ,其 中 ,&a、&b 分 别 是 实 参 a .5 的 地 址 ， 
显然 改正 后 的 算法 swap2O 〇 比较 复杂 ,可 读 性 差 。 

改正 方法 2: 采用 引用 型 形 参 , 也 就 是 将 输出 型 形 参 设计 为 引用 类 型 形 参 。 

在 C++ 语言 中 提供 了 一 种 引用 运算 符 “&”。 当 建立 引用 时 ,程序 用 另 一 个 已 定义 的 变 
量 ( 目 标 变 量 ) 的 名 字 初 始 化 它 , 从 那 时 起 ,引用 变量 作为 目标 变量 的 别名 使 用 ,对 引用 变量 
的 改动 实际 是 对 目标 变量 的 改动 。 例 如 : 


int a 一 4; // 定 义 整 型 变量 a 
int &b=a; // 定 义 整 型 变量 a 的 引用 变量 b 


第 2 个 语句 定义 5 变量 是 变量 a 的 引用 变量 ,b 也 等 于 4, 之 后 这 两 个 变量 同步 改变 。 
引用 常用 于 函数 形 参 中 , 当 采 用 引用 型 形 参 时 ,在 函数 调用 时 会 将 形 参 的 改变 回 传 给 实 
。 利 用 引用 运算 符 将 swap10) 改 为 如 下 : 


各 


void swap(int &x,int &y) ”// 形 参 前 的 "&" 符 号 不 是 指针 运算 符 , 而 是 引用 
{ int tmp=x; 
x=y; y=tmp; 


} 
当 执 行 语句 swap(a,5) 时 , 形 、 实 参 的 匹配 相当 于 : 


int &x 一 ai //x 为 a 的 引用 
int &y=b; //y 为 b 的 引用 


这 样 ,a 与 x 共享 存储 空间 ,6 与 y 共享 存储 空间 ,因此 执行 函数 后 a 和 2 的 值 发 生 了 交 
换 。 这 种 改进 方式 十 分 简单 ,所 以 本 书后 面 均 采 用 这 种 方式 设计 算法 。 

【 例 1.5】 设计 一 个 算法 , 求 一 元 二 次 方程 az: 十 bz 十 c 一 0 的 根 。 

该 算法 的 输入 为 a.b 和 c, 输 出 为 根 的 个 数 和 两 个 根 ,将 a.5b 和 c 作为 输入 型 形 参 , 采 
用 函数 的 返回 值 表示 根 的 个 数 ,用 两 个 引用 型 形 参 zl 和 z2 表示 两 个 根 。 对 应 算法 的 描述 如 下 : 


int solution(double a, double b, double ¢, double &x1, double &x2) 
{ doubled; 
d=bx*b—4x*axc; 
if (d>0) 
{ xl=(—b++sqrt(d))/(2*a); 
x2=(—b—sqrt(d))/(2* a); 
return 2; // 两 个 实 根 
} 
else if (d==0) 
Ca 


return 1; // 一 个 实 根 
} 
else //d<0 的 情况 
return 0; // 不 存在 实 根 ,返回 0 
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算法 分 析 人 


在 一 个 算法 设计 好 之 后 ,还 需要 对 其 进行 分 析 ,确定 一 个 算法 的 优 劣 。 本 节 讨论 算 法 的 
时 间 复 杂 度 和 空间 复杂 度 分 析 。 


131 算法 分 析 概 述 


算法 分 析 就 是 分 析 算 法 占用 计算 机 资源 的 多 少 。 而 计算 机 资源 主要 是 
CPU 时 间 和 内 存 空 间 , 分 析 算 法 占用 CPU 时 间 的 多 少 称 为 时 间 性 能 分 析 ， 
分 析 算 法 占用 内 存 空间 的 多 少 称 为 空间 性 能 分 析 。 

算法 分 析 的 目的 是 分 析 算 法 的 时 空 性 能 以 便 改进 算法 。 


132 算法 时 间 性 能 分 析 i 
间作 化 分 析 方 六 


通常 有 两 种 衡量 算法 时 间 性 能 的 方法 , 即 事 后 统计 法 和 事前 估算 法 。 Es 

事后 统计 法 就 是 编写 算法 对 应 程序 ,统计 其 执行 时 间 。 一 个 算法 用 计 ty 
算 机 语言 实现 后 ,在 计算 机 上 执行 所 消耗 的 时 间 与 很 多 因素 有 关 , 如 计算 机 的 运行 速度 、 编 
写 程 序 采用 的 计算 机 语言 、 编 译 产生 的 机 器 语言 代码 质量 和 问题 的 规模 等 。 这 种 方法 存在 
的 缺点 有 两 个 ,一 是 必须 执行 程序 ,二 是 存在 很 多 因素 掩盖 了 算法 本 质 。 

事前 合算 法 是 撤 开 这 些 与 计算 机 硬件 ,软件 有 关 的 因素 , 仅 考 虑 算法 本 身 的 效率 高 低 ， 
可 以 认为 一 个 特定 算法 的 “运行 工作 量 ” 的 大 小 只 依赖 于 问题 的 规模 (通常 用 整数 n 表示 )， 
或 者 说 算法 的 执行 时 间 是 问题 规模 的 函数 ,因此 后 面 主要 采用 事前 估算 法 来 分 析 算 法 的 时 
间 性 能 。 


2 

1) 计算 算法 的 频 度 TT(n) 

一 个 算法 是 由 控制 结构 (顺序 ,分支 和 循环 3 种 ) 和 原 操作 ( 指 固有 数据 类 型 的 操作 ) 构 
成 的 。 例 如 ,在 以 下 算法 中 ,语句 中 、@、@ 和 @ 就 是 原 操作 : 



































void fun(int a[] ,int n) 








ntl /I/D 

for (i=0;i<n;i 十 十 ) //@ 

PR a[] =2*i; //® 
for (i=0;i<n;it++) //@ 

printf("%d", a[i]); //®@ 

printf("\nm"); //®@ 


} 


而 算法 的 执行 时 间 取 决 于 控制 结构 和 原 操作 的 综合 效果 。 显 然 ,在 一 个 算法 中 执行 原 操作 
的 次 数 越 少 ,其 执行 时 间 也 就 相对 越 少 ; 执行 原 操作 次 数 越 多 ,其 执行 时 间 也 就 相对 越 多 。 


@00,4E 和 和 





也 就 是 说 ,一 个 算法 的 执行 时 间 可 以 由 其 中 原 操作 的 执行 次 数 来 计量 。 

假设 算法 的 问题 规模 为 ,如 果 对 10 个 整数 排序 ,问题 规模 n 就 是 10。 算 法 时 间 分 析 
的 就 是 求 出 算法 所 有 原 操作 的 执行 次 数 (也 称 为 频 度 ), 它 是 问题 规模 的 函数 ,用 T(x) 

算法 执行 时 间 大 致 等 于 原 操作 所 需 的 时 间 XT(n) ,也 就 是 说 T(x) 与 算法 的 执行 时 间 
成 正比 ,为 此 用 T(n) 表 示 算 法 的 执行 时 间 , 比 较 不 同 算法 的 TT(n) 大 小 得 出 算法 执行 时 间 的 
多 少 。 

【 例 1.6】 求 两 个 阶 方 阵 A 、B 相 加 C=A4 十 B 的 算法 如 下 ,计算 其 执行 时 间 T(x)。 





#define MAX 20 // 定 义 最 大 的 方 阶 
void matrixadd(int n,int A[MAX] [MAX] ,int BIMAX] [MAX] ,int CIMAX] [MAX]) 
{ inti,j; 
for (i=0;i<n;i+ 十 ) // 语 句 O 
for (j=0;j<n;j 十 十 ) // 语 句 @ 
C[I0]=ADID+BO 0 ; // 语 句 @ 
} 


如 果 不 考虑 变量 定义 语句 ,该 算法 主要 包括 3 个 可 执行 语句 人 .@ 和 四。 其 中 语句 
加 循环 控制 变量 ; 要 从 0 增加 到 ,测试 i 二 n 时 才 会 终止 , 故 它 的 频 度 是 十 1, 但 它 的 循环 
体 却 只 能 执行 次。 语句 @ 作 为 语句 循环 体内 的 语句 应 该 只 执行 次 ,但 语句 @ 本 身 也 
要 执行 n 十 1 次 ,所 以 语句 @ 的 频 度 是 n(n 十 1)。 同 理 可 得 语句 @ 的 频 度 为 n* 。 因 此 ,该 算 
法 中 所 有 语句 的 频 度 之 和 ( 即 执行 时 间 ) 为 

T(n) = 二 nn 十 1 十 n(n 十 1) 二 nn = 二 2m 十 2n 十 1 

2) T(n) 用 "0" 表示 

由 于 算法 分 析 不 是 绝对 时 间 的 比较 ,在 求 出 T(x) 后 ,通常 进一步 采用 时 间 复 杂 度 来 表 
示 。 算 法 时 间 复 杂 度 (time complexity) 就 是 用 T(n) 的 数量 级 来 表示 , 记 作 T(n) = 
OC O00)), 

在 上 述 表 达 式 中 “0” 读 作 “ 大 0O”( 是 Order 的 简写 , 意 指数 量 级 ) ,其 含义 是 为 T(n) 找 
到 一 个 上 界 f(x) ,其 严格 的 数学 定义 是 T(n) 的 数量 级 表示 为 O(/(n)), 是 指 存在 着 正常 量 
< 各 (为 一 个 足够 大 的 正 整数 ), 使 得 im 上 oo | 一 < 关 0 成 立 。 所 以 算法 时 间 复杂 度 也 称 
为 渐进 时 间 复 杂 度 , 它 表示 随 问题 规模 的 增 大 ,算法 执行 时 间 的 增长 率 和 /(n) 的 增长 率 
相同 。 因 此 算法 时 间 复 杂 度 分 析 实 际 上 是 一 种 时 间 增 长 趋势 分 析 。 











显然 ,T(n) 的 这 种 上 界 FCz) 可 能 有 多 个 ,通常 取 最 紧凑 的 上 界 。 也 就 是 只 求 出 T(n) es 


的 最 高 阶 ,忽略 其 低 阶 项 和 常 系数 ,这 样 既 可 简化 TCz) 的 计算 ,又 能 比较 客观 地 反映 出 当 ? 
很 大 时 算法 的 时 间 性 能 。 例 如 ,对 于 例 1.6 有 Tx) 二 2 十 2n 十 1 二 Ol), 也 就 是 说 ,该 算 
法 的 时 间 复 杂 度 为 O(n? ) 。 

一 般 情况 下 ,一 个 没有 循环 (或 者 有 循环 ,但 循环 次 数 与 问题 规模 n 无 关 ) 的 算法 中 原 操 
作 执 行 次 数 与 问题 规模 无关, 记 作 O(1), 也 称 为 常数 阶 。 算 法 中 的 每 个 简单 语句 ,例如 定 
义 变量 语句 ,赋值 语句 和 输入 输出 语句 ,其 执行 时 间 都 看 成 是 O(1) 。 
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一 个 只 有 一 重 循环 的 算法 中 原 操作 执行 次 数 与 问题 规模 的 增长 呈 线 性 增 大 关系 , 记 
作 O(z) ,也 称 线性 阶 。 

其 余 常用 的 还 有 平方 阶 OG?)、 立 方 阶 OG )、 对 数 阶 O(logzn) 、 指 数 阶 O(2") 等 ,各 种 
不 同 的 时 间 复 杂 度 存在 着 以 下 关系 : 

O(1) < O(logsn) < O(n) < O(nlogsn) < On) < Om) < O02") < On!) 

将 O(logsn)、O(n)、O(nlogsn)、O(Cm) 和 0O(m) 等 称 为 多 项 式 时 间 复 杂 度 (polynomial 
time complexity) ,将 O(2") 和 O(n!) 等 称 为 指数 时 间 复 杂 度 (exponential time complexity)。 
一 个 问题 目前 可 以 用 多 项 式 时 间 复 杂 度 的 算法 来 求解 , 称 为 P 问题 ; 一 个 问题 目前 只 能 用 
指数 时 间 复 杂 度 的 算法 求解 , 称 为 NP 问题 。NP 二 P 是 否 成 立 , 也 就 是 说 ,求解 NP 问题 的 
指数 时 间 复 杂 度 算法 能 否 转 换 成 用 多 项 式 时 间 复 杂 度 算法 来 求解 ,是 目前 计算 机 科学 的 难 
题 之 一 。 要 -要 

3) 简化 的 算法 时 间 复 杂 度 分 析 re 

另外 一 种 简化 的 算法 时 间 复 杂 度 分 析 方 法 仅仅 考虑 算法 中 的 基本 操 
作 。 所 谓 基本 操作 是 指 算 法 中 最 深层 循环 内 的 原 操 作 。 算 法 执行 时 间 大 致 - 曾 安家 全 
等 于 基本 操作 所 需 的 时 间 X 其 运算 次 数 。 所 以 在 算法 分 析 中 ,计算 TC) 时 视频 讲解 
仅仅 考虑 基本 操作 的 运算 次 数 。 

对 于 例 1.6, 采 用 简化 的 算法 时 间 复 杂 度 分 析 方法 ,其 中 的 基本 操作 是 两 重 循环 中 最 深 
层 的 语句 @ ,分 析 它 的 频 度 , 即 : 




















T(n) 一 形 一 OGz) 
从 两 种 方法 得 出 算法 的 时 间 复 杂 度 均 为 O(n ) ,而 后 者 的 计算 过 程 简单 得 多 ,所 以 后 面 
主要 采用 简化 的 算法 时 间 复 杂 度 分 析 方 法 。 
【 例 1.7】 分 析 以 下 算法 的 时 间 复 杂 度 。 


void func(int n) 
{ inti=0,s=0; 


while (s<n) 
{ rs // 基 本 操作 
s=s+i; // 基 本 操作 


} 
} 


该 算法 的 基本 操作 是 while 循环 内 的 语句 , 设 while 循环 执行 的 次 数 为 m, 变 量 i 从 
0 开始 递增 1, 直到 m 为 止 ,所 以 循环 结束 时 有 s 二 mlm 十 1)/2 三 n, 增 加 一 个 用 于 修正 的 常 
量 k, 则 mm(m 十 1)/2 十 k= 二 n。 求 出 : 

eh | 

所 以 ,该 算法 的 时 间 复 杂 度 为 OOVz ) 。 

4) 时 间 复 杂 度 的 求 和 、 求 积 定理 

为 了 计算 算法 的 时 间 复 杂 度 .有 以 下 两 个 定理 。 

求 和 定理 : 假设 Ti(n) 和 T,(n) 是 程序 段 PP，, 的 执行 时 间 , 并 且 Ti(n) 二 O(f(n))， 
Ts(n) 二 Ol(g (n)), 那 么 先 执行 P .再 执行 P; 的 总 执行 时 间 是 Ti (Cz) 十 T (2z) 一 
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OC(MAX(f(n),g(n)))。 例 如 多 个 并 列 循环 就 属于 这 种 情况 。 

求 积 定理 : 假设 Ti(n) 和 T,(n) 是 程序 段 P 、P; 的 执行 时 间 , 并 且 Ti(n) 二 O(f(n))， 
(7) 二 OC(g(7)), 那 么 TD)XT, (7) 二 O(f00)Xg0))。 例 如 多 层 柚 套 循环 就 属于 这 种 情况 。 

3 算 沁 的 最 好 \ 最 坏 和 平 拘 时间 复 淋 度 扫 -- 扫 

设 一 个 算法 的 输入 规模 为 n,D, 是 所 有 输入 (实例 ) 的 集合 ,任意 输入 ”回味 
TIED,,P(TD 是 工 出 现 的 频率 ， 有 PD 二 1, T(D) 是 算法 在 输入 I 下 所 


执行 的 基本 操作 次 数 , 则 该 算法 的 平均 时 间 复 杂 度 定义 为 二 
E(n) = SD)P(D x TD 


IED， 

算法 的 最 好 时 间 复 杂 度 是 指 算法 在 最 好 情况 下 的 时 间 复 杂 度 , 即 B(z) 一 MIN{1T(z))}。 
算法 的 最 坏 复杂 度 是 指 算法 在 最 坏 情况 下 的 时 间 复 杂 度 , 即 为 的 (2 二 MAX1T(Cz)}。 算 法 
的 最 好 情况 和 最 坏 情况 分 析 是 寻找 该 算法 的 极端 实例 ,然后 分 析 在 该 极端 实例 下 算法 的 执 
行 时 间 。 

从 中 可 以 看 出 ,计算 平均 时 间 复 杂 度 时 需要 考虑 所 有 的 情况 ,而 计算 最 好 和 最 坏 时 间 复 杂 
度 时 主要 考虑 一 种 或 几 种 特殊 的 情况 。 通 常 默认 情况 下 的 时 间 复 杂 度 是 指 年 均 时 间 复 杂 度 。 

【 例 1.8】 以 下 算法 用 于 求 含 n 个 整数 元 素 的 序列 中 前 i(1<i 二 个 元 素 的 最 大 值 ， 
分 析 该 算法 的 最 好 、 最 坏 和 平均 时 间 复 杂 度 。 







int fun(int a[] ,int n, int i) 
{ intj, max=a[0]; 
for Gel 1 
if (aD]> max) max=a[0] ; 
return(max); 


} 


该 算法 中 的 整数 序列 用 数组 a 表示 ,前 i 个 元 素 为 a[0..i 一 1]。i 的 取 值 范围 为 
1~n( 共 n 种 情况 ), 当 求 前 i 个 元 素 的 最 大 值 时 需要 元 素 比 较 (i 一 1) 一 1 十 1=i 一 1 次 。 在 
等 概率 情况 (每 种 情况 的 概率 为 1/n) 下 : 

让 > LG D) pp 1) 7 OW) 

所 以 该 算法 的 平均 时 间 复 杂 度 为 O(n)。 

最 好 的 情况 是 i 王 1 时 ,没有 两 个 元 素 之 间 的 比较 ,对 应 的 最 好 时 间 复 杂 度 为 0(1)。 

最 坏 的 情况 是 i=n 时 ,需要 "一 1 次 两 个 元 素 之 间 的 比较 ,对 应 的 最 坏 时 间 复 杂 度 为 
On) 。 


递归 算法 是 指 算法 中 出 现 调用 自己 的 成 分 。 递归 算法 分 析 不 能 采用 前 
面 简单 的 分 析 方 法 ,递归 算法 分 析 也 称 为 变 长 时 空 分 析 , 非 递归 算法 分 析 也 
称 为 定 长 时 空 分 析 。 

在 递归 算法 分 析 中 首先 写 出 对 应 的 递 推 式 , 然 后 求解 递 推 式 得 出 算法 
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的 执行 时 间或 者 空间 。 下 面 通过 一 个 示例 讨论 递归 算法 的 时 间 分 析 方 法 。 
【 例 1.9】 有 以 下 算法 : 


void fun(int a[] ,int n, int k) // 数 组 a 共有 n 个 元 素 ,执行 时 间 为 Tl(n,k) 
1 intis 
if (k==n—1) 
{ for (i=0;i<n;it 二 ) 
printf("% d\n",a[i]); // 该 语句 的 执行 次 数 为 n 
} 
else 
{ for (i=k;i<n;i+t 二 ) 
a[ 丫 一 a[ 丫 十 ix 让 // 该 语句 的 执行 次 数 为 n 一 k 
fun(a,n,k+1); // 执 行 时 间 为 Tl(n,k 十 1) 
} 


} 


调用 上 述 算法 的 语句 为 fun(a,n,0), 求 其 时 间 复 杂 度 。 
设 fun(a,n,k) 的 执行 时 间 为 T(rn,k) ,fun(a.n,0) 的 执行 时 间 为 T(n) ,显然 有 
T(W) 三 Ti(n,0) ,由 fun() 算 法 得 到 以 下 执行 时 间 的 递 推 式 。 
当 & 一? 一 1 时 


(n 一 k) 十 Ti(ns,k 十 1) 其 他 情况 


Ti(n,k) = 


则 : 
T(n)=T(n,0)=n+ Ti(n,1) 
=n 十 (n 一 1) 二 Ti(n,2) 


nn 十 (n 一 1) 十 … 十 2 十 Ti (n,n 一 1) 


(nt+2)(n—1) 六 
2 +n 2 1 


=O(n’) 
所 以 调用 fun(a,n,0) 的 时 间 复 杂 度 为 O(n?)。 


133 算法 空间 性 能 分 析 


一 个 算法 的 存储 量 包括 输入 数据 所 占 的 空间 ,程序 本 身 所 占 的 空间 和 入 
临时 变量 所 占 的 空间 。 这 里 在 对 算法 进行 存储 空间 分 析 时 只 考察 临时 变量 。 六 本 
所 占 的 空间 ,例如 对 于 如 图 1. 16 所 示 的 算法 ,其 中 临时 空间 为 变量 imaxi 占用 的 空间 。 



































int max(int a[]，int n) 
{ int i, maxi=0; 函数 体内 分 配 的 变量 空间 
for 《=1;ic=n; 计 +) 为 临时 空间 ， 不 计 形 参 占 
if (a[i]>almaxi]) 用 的 空间 ,这 里 仅 计 冯 
ee maxi 变 量 的 空间 ， 其 空间 
return a[maxi] 复杂 度 为 0(1) 





1.16 一 个 算法 的 临时 空间 


[> 


CAME 认 





所 以 ,算法 空间 复杂 度 (space complexity) 是 对 一 个 算法 在 运行 过 程 中 临时 占用 的 存储 

空间 大 小 的 量度 。 一 般 也 作为 问题 规模 的 函数 ,以 数量 级 形式 给 出 , 记 作 
S(n) = O(g(m) 

其 中 O 的 含义 与 时 间 复 杂 度 中 的 含义 相同 。 

若 所 需 临 时 空间 相对 于 问题 规模 来 说 是 常数 , 则 称 此 算法 为 原 地 工作 算法 或 就 地 工作 
算法 。 

为 什么 算法 占用 的 空间 只 需 考 虑 临时 空间 ,而 不 必 考 虑 形 参 的 空间 呢 ? 这 是 因为 形 参 
的 空间 会 在 调用 该 算法 的 算法 中 考虑 ,例如 以 下 maxfun 算法 调用 图 1. 16 的 max 算法 : 


void maxfun() 

{ intb[]={1,2,3,4,5},n=5; 
printf("Max= % d\n", max(b, n)); 

} 


maxfun 算法 中 为 5 数组 分 配 了 相应 的 内 存 空间 ,其 空间 复杂 度 为 O(n) ,如果 在 max 算 
法 中 再 考虑 形 参 a 的 空间 ,这 样 就 重复 计算 了 占用 的 空间 。 实 际 上 在 C/C++ 语言 中 ， 
maxfun 调用 max 时 ,max 算法 中 形 参 a 只 是 一 个 指向 实 参 4b 数组 的 指针 , 即 形 参 a 只 分 配 
一 个 地 址 大 小 的 空间 ,并 非 另外 分 配 5 个 整 型 单元 的 空间 。 
【 例 1.10】 分 析 例 1.6 和 例 1.7 算法 的 空间 复杂 度 。 
在 这 两 个 算法 中 都 仅仅 固定 分 配 了 几 个 临时 变量 ,占用 存储 空间 的 大 小 与 问题 规 
模 寻 无 关 , 所 以 它们 的 空间 复杂 度 均 为 0(1), 即 这 些 算法 均 为 原 地 工作 算法 。 
2 阳 闻 算 半 宝 间 复 革 度 放 他 
对 于 递归 算法 ,为 了 实现 递归 过 程 用 到 一 个 递归 栈 ,所 以 需要 根据 递归 深度 得 到 算法 的 
空间 复杂 度 。 下 面 通过 一 个 示例 讨论 递归 算法 的 空间 分 析 方 法 。 
【 例 1. 11〗 对 于 例 1.9 的 算法 ,分 析 调 用 语句 fun(a,n,0) 的 空间 复杂 度 。 
设 fun(a,n,k) 占 用 的 临时 空间 为 Si (n,k) ,funCa,n,0) 占 用 的 临时 空间 为 SCz) , 显 
然 有 S() 二 Si1(n,0) ,由 fun() 算 法 得 到 以 下 占用 临时 空间 的 递 推 式 。 
1 当 角 二 一 1 时 (此 时 仅仅 定义 了 一 个 临时 变量 让 
1 十 Si 十 1) 其 他 情况 


Si(n,k) = 


则 : 





S(W)=S1(n.0)=1+Si(n,1) 
二 1 十 1 十 Si (2z,2) 





一 1 十 1 十 … 十 1 十 Si Cam 一 1) 
三 1 十 1 十 … 十 1 二 O(n) 
CTS 
n 个 1 
所 以 调用 fun(a,n,0) 的 空间 复杂 度 为 O(n)。 
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数据 结构 十 算法 = 程序 ” 洲 


计算 机 软件 的 最 终 成 果 都 是 以 程序 的 形式 表现 的 ,数据 结构 和 算法 分 析 的 目的 是 设计 
好 的 程序 ,著名 的 计算 机 科学 家 沃 思 (N. Wirth) 专 门 出 版 了 《数据 结构 十 算法 = 程序 ) 一 书 ， 
其 中 指出 程序 是 由 算法 和 数据 结构 组 成 的 ,程序 设计 的 本 质 是 对 要 处 理 的 问题 选择 好 的 数 
据 结构 ,同时 在 此 结构 上 施加 一 种 好 的 算法 。 
计算 机 科学 家 简介 

N. Wirth(1934 年 出 生 ) ,瑞士 计算 机 科学 家 , 1960 年 获 加 利 福 
尼 亚 大 学 伯克利 分 校 博士 学 位 。 曾 任 斯 坦 福 大 学 、 苏 黎 世 联邦 理工 
学 院 教授 。 发 明 多 种 计算 机 语言 (包括 Pascal、Modula 和 Oberon 
等 ), 并 在 软件 工程 领域 作出 过 开拓 性 的 贡献 。 他 于 1980 年 获得 计 
算 机 科学 界 最 高 奖 灵 奖 (http://en. wikipedia. org/wiki/ 
Turing_Award) 。 

















141 程序 和 数据 结构 


对 于 一 个 程序 来 说 ,数据 是 “原料 ”。 一 个 程序 所 要 进行 的 计算 或 处 理 总 是 以 某 些 数据 
为 对 象 的 。 将 松散 、 无 组 织 的 数据 按 某 种 要 求 组 成 一 种 数据 结构 ,对 于 设计 一 个 简明 、 高 效 、 
可 靠 的 程序 是 大 有 益处 的 。 沃 思 指出 ,程序 就 是 在 数据 的 某 些 特定 的 表示 方法 和 结构 的 基 
础 上 对 抽象 算法 的 具体 表述 ,所 以 说 程序 离 不 开 数 据 结 构 。 

程序 是 通过 某 种 程序 设计 语言 描述 的 ,程序 设计 语言 具有 实现 数据 结构 和 算法 的 机 制 ， 
其 中 类 型 声明 与 对 象 定义 用 于 实现 数据 结构 ,而 语句 实现 算法 ,描述 程序 的 行为 。 


142 算法 和 程序 


由 程序 设计 语言 描述 的 算法 就 是 计算 机 程序 。 对 于 一 个 求解 问题 而 言 ,算法 就 是 解 题 
的 方法 ,没有 算法 ,程序 就 成 了 无 本 之 木 ,无 源 之 水 ; 有 了 算法 ,将 它 表 示 成 程序 是 不 困难 
的 。 算 法 是 程序 的 “灵魂 ”, 算 法 在 整个 计算 机 科学 中 的 地 位 都 是 极其 重要 的 。 


143 算法 和 数据 结构 


求解 的 问题 可 以 通过 抽象 数据 类 型 来 描述 , 它 由 数据 的 多 辑 结构 和 抽象 运算 两 部 分 组 
成 。 一 种 数据 的 逻辑 结构 可 以 映射 成 多 种 存储 结构 ,抽象 运算 在 不 同 的 存储 结构 上 实现 可 
以 对 应 多 种 算法 ,在 同一 种 存储 结构 上 实现 也 可 能 有 多 种 算法 ,通过 算法 的 时 间 复 杂 度 和 空 
间 复 杂 度 等 分 析 可 以 得 到 好 的 算法 ,如 图 1. 17 所 示 。 

注意 ,不 能 离开 数据 结构 去 抽象 地 考虑 算法 ,也 不 能 脱离 算法 去 孤立 地 讨论 数据 结构 ， 
只 能 从 算法 与 数据 结构 的 统一 上 去 认识 程序 。 

数据 存储 结构 会 影响 算法 的 好 坏 , 因 此 大 家 在 选择 存储 结构 时 也 要 考虑 其 对 算法 的 影 
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抽象 数据 类 型 = 数据 的 逻辑 结构 + 抽象 运算 (运算 的 功能 描述 ) 











数据 的 存储 结构 1 ee 数据 的 存储 结构 抽象 运算 的 实现 
算法 11 … 算法 lm  … 算法 nl … ”算法 nk 
几 算法 分 析 
视频 讲解 好 的 算法 











图 1.17 设计 好 算法 的 过 程 


响 。 存 储 结构 对 算法 的 影响 主要 在 下 面 两 个 方面 。 

1T“ 歪 储 绍 和 构 的 存储 能 力 

如 果 存储 结构 的 存储 能 力 强 、 存 储 的 信息 多 ,算法 将 会 较 好 设计 。 反 之 ,对 于 比较 简单 
的 存储 结构 可 能 要 设计 一 套 比 较 复杂 的 算法 。 在 这 一 点 上 经 常 体现 时 间 与 空间 的 矛盾 , 往 
往 存储 能 力 是 与 所 使 用 的 空间 大 小 成 正比 的 。 

2 行情 绍 煌 应 与 所 选择 的 算 决 相 适 簿 





存储 结构 是 实现 算法 的 基础 ,也 会 影响 算法 的 设计 ,其 选择 要 充分 考虑 算法 的 各 种 操 
作 , 应 与 算法 的 操作 相 适 应 。 

所 以 说 设计 算法 与 选择 合适 的 数据 结构 是 程序 设计 中 相辅相成 的 两 个 方面 , 缺 一 不 可 。 
数据 结构 的 选择 一 直 是 程序 设计 中 的 重点 和 难点 ,正确 地 应 用 数据 结构 往往 能 带 来 意 想 不 
到 的 效果 。 反 之 ,如 果 忽视 了 数据 结构 的 重要 性 ,对 某 些 问题 有 时 就 得 不 到 满意 的 解答 。 

算法 通常 是 决定 程序 效率 的 关键 ,但 一 切 算法 最 终 都 要 在 相应 的 数据 结构 上 实现 ,许多 
算法 的 精髓 就 是 在 于 选择 了 合适 的 数据 结构 作为 基础 。 在 程序 设计 中 不 仅 要 注重 算法 设 
计 , 也 要 正确 地 选择 数据 结构 ,这 样 往往 能 够 事半功倍 。 


144 数据 结构 的 发 展 


早期 的 计算 机 主要 应 用 于 科学 计算 , 随 着 计算 机 的 发 展 和 应 用 范围 的 拓宽 ,计算 机 需要 
处 理 的 数据 量 越 来 越 大 ,数据 的 类 型 越 来 越 多 ,数据 的 结构 越 来 越 复杂 ,计算 机 的 对 象 从 简 
单 的 纯 数 值 性 数据 发 展 为 非 数 值 性 的 和 具有 一 定 结构 的 数据 。 于 是 要 求人 们 对 计算 机 加 工 
处 理 的 对 象 进行 系统 的 研究 , 即 研究 数据 的 特性 、 数 据 之 间 存 在 的 关系 ,以 及 如 何 有 效 地 组 





织 ,管理 存储 数据 ,从 而 提高 计算 机 处 理 数据 的 效率 。 数 据 结 构 这 门 学 科 就 是 在 此 背景 上 逐 aa 


渐 形成 和 发 展 起 来 的 。 

数据 结构 的 概念 最 早 由 C. A. R. Hoare 和 N. Wirth 在 1966 年 提出 ,对 这 一 发 展 做 出 杰 
出 贡献 的 是 D. E. Kunth 和 C. A. R. Hoare,D.E. Kunth 的 《计算 机 程序 设计 技巧 ) 和 C. A. 
R. Hoare 的 《数据 结构 札记 》, 这 两 部 著作 对 数据 结构 这 门 学 科 的 发 展 做 出 了 重要 贡献 。 大 
量 关 于 程序 设计 理论 的 研究 表明 : 对 大 型 复杂 程序 的 构造 进行 系统 而 科学 的 研究 ,必须 对 
这 些 程序 中 所 包含 的 数据 结构 进行 深入 的 研究 。 随 着 计算 机 科学 的 飞速 发 展 ,到 20 世纪 





数据 结构 教程 \ 目 GO 





80 年 代 初 期 ,数据 结构 的 基础 研究 日 至 成 熟 ,已 经 成 为 一 门 完整 的 学 科 。 
计算 机 科学 家 简介 


Donald Knuth(1938 年 出 生 ) ,算法 和 程序 设计 技术 的 先驱 者 , 计 
算 机 排版 系统 TEX 和 METAFONT 的 发 明 者 ,他 因 这 些 成 就 和 大 量 
创造 性 的 影响 深远 的 著作 (19 部 专著 和 160 篇 论文 ) 而 誉 满 全 球 。 
作为 斯 坦 福 大 学 计算 机 程序 设计 艺术 的 荣誉 退休 教授 ,他 当前 正 全 
神 贯 注 于 完成 其 关于 计算 机 科学 的 史诗 性 的 七 卷 集 。 这 一 伟大 工 
程 在 1962 年 他 还 是 加 州 理工 学 院 的 研究 生 时 就 开始 了 。 他 于 1974 
年 获得 计算 机 科学 界 最 高 奖 一 一 图 灵 奖 。 




















C.A.R. Hoare(1934 年 出 生 ) ,英国 计算 机 科学 家 ,毕业 于 牛津 
大 学 ,他 的 贡献 是 发 布 了 快速 排序 算法 .Hoare 逻辑 .形式 语言 通信 
时 序 进程 (CSP) 等 。 他 于 1980 年 获得 计算 机 科学 界 最 高 奖 一 一 图 














Ah 本 章 小 结 一 < 一 


本 章 介绍 了 数据 结构 的 基本 概念 ,主要 学 习 要 点 如 下 : 

(1) 理解 数据 结构 的 定义 ,数据 结构 包含 的 逻辑 结构 .存储 结构 和 运算 
三 方面 的 相互 关系 。 

(2) 掌握 各 种 逻辑 结构 ( 即 线性 结构 、 树 形 结构 和 图 形 结构 ) 的 特点 。 

(3) 了 解 各 种 存储 结构 ( 即 顺 序 存储 结构 、 链 式 存 储 结构 .索引 和 散 列 ) 
之 间 的 差别 。 

(4) 了 解数 据 类 型 和 抽象 数据 类 型 的 概念 和 区 别 。 

(5) 掌握 算法 定义 及 特性 。 

(6) 掌握 使 用 C/C++ 语言 描述 算法 的 方法 。 

(7) 重点 掌握 算法 的 时 间 复 杂 度 和 空间 复杂 度 分 析 方 法 。 

(8) 掌握 从 数据 结构 的 角度 求解 问题 的 基本 过 程 。 























收 贞 收 帐 


一 人 练习 题 1 一 


1. 简 述 数据 与 数据 元 素 的 关系 与 区 别 。 

2. 采用 二 元 组 表示 的 数据 逻辑 结构 S 二 < D,R >, 其 中 D={a,b,…,i) ,R= {r},r 二 
{<asb>,<asc>,<c,d>,<c,f>,<f,h>,<d,e>,<f,g>,<h,i>}, 问 关系 + 是 什么 类 型 的 
逻辑 结构 ? 哪些 结 点 是 开始 结 点 ,哪些 结 点 是 终端 结 点 ? 


@00,42E 和 和 


. 简 述 数据 逻辑 结构 与 存储 结构 的 关系 。 

. 简 述 数据 结构 中 运算 描述 和 运算 实现 的 异同 。 

. 数据 结构 和 数据 类 型 有 什么 区 别 ? 

. 在 C/C++ 中 提供 了 引用 运算 符 , 简 述 其 在 算法 描述 中 的 主要 作用 。 
.有 以 下 用 C/C++ 语言 描述 的 算法 ,说 明 其 功能 : 


I 


void fun( double &y, double x, int n) 
Hy 
while (n>1) 
0 py 
| .ts 
} 
} 


8. 用 C/C++ 语言 描述 下 列 算法 ,并 给 出 算法 的 时 间 复 杂 度 。 
(1) 求 一 个 nn 阶 二 维 数 组 的 所 有 元 素 之 和 。 
(2) 对 于 输入 的 任意 3 个 整数 ,将 它们 按 从 小 到 大 的 顺序 输出 。 
(3) 对 于 输入 的 任意 7 个 整数 ,输出 其 中 的 最 大 和 最 小 元 素 。 
9. 设 3 个 表示 算法 频 度 的 函数 /、g 和 分别 为 

fln) = 100m + 二 +1000 

g(n) = 25n + 5000n’ 

h(n) = ns + 5000nlogsn 
求 它们 对 应 的 时 间 复 杂 度 。 
10. 分 析 下 面 程序 段 中 循环 语句 的 执行 次 数 。 





int j=0, s=0, n= 100; 
do 
jy 
Ss 三 s 十 10 #j; 
} while G<n &&. s<n); 


11. 设 ”为 正 整数 ,给 出 下 列 3 个 算法 关于 问题 规模 的 时 间 复 困 度 。 
(1) 算法 1: 
void funl(int n) 


RT kl00% 
while (i<=n) 





Ve ks 
; 证 一 好 aa 
(2) 算法 2: 


void fun2(int b[],int n) 
1‘ intij,k,xs 
or 
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{ k=i; 
for (jj 一 i 填 1;j<nj;j 十 十 ) 
if (b[kJ> bG]) k=j; 
x=b[i] ;b[i] =b[k];b[k] =x; 


} 


(3) 算法 3: 


void fun3(int n) 

{ inti=0,s=0; 
while (s<=n) 
ee 

elly 
} 
} 


12. 有 以 下 递归 算法 用 于 对 数组 a[i..j] 的 元 素 进行 归并 排序 : 


void mergesort(int a[] ,int i, int j) 
{ intm; 
if (il 一 j) 
© 二 三 (ij)7/27 
mergesort(a,i, m); 
mergesort(a, m+1,j); 
merge(a,i,j, m); 
} 
} 


求 执行 mergesort(a,0,n 一 1) 的 时 间 复 杂 度 。 其 中 ,merge(a,i,j,m) 用 于 两 个 有 序 子 序 
列 a[i..mwJj 和 a[Lm 十 1.. 站 的 合并 ,是 非 递 归 函 数 . 它 的 时 间 复 杂 度 为 O( 合 并 的 元 素 个 数 ) 。 

13. 描述 一 个 集合 的 抽象 数据 类 型 ASet, 其 中 所 有 元 素 为 正 整数 ,集合 的 基本 运算 包括 : 

(1) 由 整数 数组 a[0..n 一 1] 创 建 一 个 集合 。 

(2) 输出 一 个 集合 的 所 有 元 素 。 

(3) 判断 一 个 元 素 是 否 在 一 个 集合 中 。 

(4) 求 两 个 集合 的 并 集 。 

(5) 求 两 个 集合 的 差 集 。 

(6) 求 两 个 集合 的 交集 。 





ro 在 此 基础 上 设计 集合 的 顺序 存储 结构 ,并 实现 各 基本 运算 的 算法 。 


一 上 机 实验 题 1 一 一 
戎 验证 性 实验 
实验 题 1, 求 1~n 的 连续 整数 和 
目的 : 通过 对 比 同一 问题 不 同 解法 的 绝对 执行 时 间 体会 不 同 算法 的 优 劣 。 


CAME 论 





内 容 : 编写 一 个 程序 exp1-1. cpp, 对 于 给 定 的 正 整数 ，, 求 1 十 2 十 … 十 n, 采 用 逐个 累加 
与 n(n 十 1)/2( 高 斯 法 ) 两 种 解法 。 对 于 相同 的 ,给 出 这 两 种 解法 的 求 和 结果 和 求解 时 间 ， 
并 用 相关 数据 进行 测试 。 

实验 题 2: 常见 算法 时 间 函 数 的 增长 趋势 分 析 

目的 : 理解 常见 算法 时 间 函 数 的 增长 情况 。 

内 容 : 编写 一 个 程序 exp1-2. cpp, 对 于 1 一 的 每 个 整数 ,输出 logsn、Wn、n、nlogzn、 
ma 2” 和 72! 的 值 。 
其 设计 性 实验 

实验 题 3: 求 素数 的 个 数 

目的 : 通过 对 比 同一 问题 不 同 解法 的 绝对 执行 时 间 体 会 如 何 设计 “好 ”的 算法 。 

内 容 : 编写 一 个 程序 exp1-3. cpp, 求 1~n 的 素数 个 数 。 给 出 两 种 解法 ,对 于 相同 的 ，， 
给 出 这 两 种 解法 的 结果 和 求解 时 间 ,并 用 相关 数据 进行 测试 。 

实验 题 4: 求 连续 整数 阶乘 的 和 

目的 : 体会 如 何 设计 “好 ”的 算法 。 

内 容 : 编写 一 个 程序 exp1-4. cpp, 对 于 给 定 的 正 整数 , 求 11 十 21 十 31 十 … 十 n1。 给 出 
一 种 时 间 复 杂 度 为 O(n) 的 解法 。 








线性 表 是 一 种 典型 的 线性 结构 , 也 是 一 种 最 常用 的 数据 结构 。 
线性 表 的 例子 不 胜 枚 举 , 例如 英文 字母 表 (A, B, …, Z) 是 一 个 线性 
表 , 表 中 的 每 个 英文 字母 就 是 一 个 数据 元 素 ; 又 如 成 绩 单 是 一 个 线 
性 表 , 表 中 的 每 个 成 绩 记 录 是 一 个 数据 元 素 , 每 个 数据 元 素 又 是 由 
学 号 姓名、 成 绩 等 数据 项 组 成 的 。 

本 章 介绍 线性 表 的 定义 、 线 性 表 的 顺序 和 链 式 两 类 存储 结构 以 
及 相关 算法 的 实现 ,线性 表 的 应 用 和 有 序 表 等 。 
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线性 表 及 其 逻辑 结构 洲 


在 讨论 线性 表 的 存储 结构 之 前 先 分 析 其 逻辑 结构 。 本 节 介绍 线性 表 的 定义 和 线性 表 的 
抽象 数据 类 型 描述 。 


211 线性 表 的 定义 

线性 表 (linear list) 是 具有 相同 特性 的 数据 元 素 的 一 个 有 限 序 列 。 该 序 
列 中 所 含 元 素 的 个 数 叫 线性 表 的 长 度 , 用 表示,n 宇 90。 当 n==0 时 ,表示 线 
性 表 是 一 个 空 表 , 即 表 中 不 包含 任何 元 素 。 在 线性 表 中 每 个 数据 元 素 由 好 


辑 序号 唯一 确定 , 设 序 列 中 的 第 i(i 表示 逻辑 序号 ) 个 元 素 为 a;(1 志 i<n), 则 线性 表 的 一 般 
表示 为 

















(al az 和 aiy 和 yan) 
其 中 ai 为 第 一 个 元 素 , 又 称 为 表 头 元 素 ,as 为 第 2 个 元 素 ,a, 为 最 后 一 个 元 素 , 又 称 为 表 尾 元 素 。 
线性 表 中 的 元 素 呈 现 线性 关系 , 即 第 i 个 元 素 a; 处 在 第 i 一 1 个 元 素 a;-1 的 后 面 ,第 
i 十 1 个 元 素 ai+1 的 前 面 。 线 性 表 用 二 元 组 表示 为 L 二 (D,R) ,其 中 : 


D={ ai| 1<i<n,n 宇 0,a;i 为 ElemType 类 型 } //ElemType 是 自 定义 的 类 型 标识 符 
R={r} 
r={<ai,am> | 1Si<n—1} //ai 与 ai+1 相 邻 (有 序 ) 


对 应 的 逻辑 结构 图 形 表 示 如 图 2. 1 所 示 。 


©O-O- --O-@-- 


图 2.1 线性 表 逻 辑 结 构 的 图 形 表示 





从 线性 表 的 定义 可 以 看 出 , 它 具 有 以 下 特性 : 

(1) 有 穷 性 : 一 个 线性 表 中 的 元 素 个 数 是 有 限 的 。 

(2) 一 致 性 : 一 个 线性 表 中 所 有 元 素 的 性 质 相同 。 从 实现 的 角度 看 ,所 有 元 素 具有 相 
同 的 数据 类 型 。 

(3) 序列 性 : 一 个 线性 表 中 所 有 元 素 之 间 的 相对 位 置 是 线性 的 , 即 存在 唯一 的 开始 元 
素 和 终端 元 素 , 除 此 之 外 ,每 个 元 素 只 有 唯一 的 前 驱 元 素 和 后 继 元 素 。 各 元 素 在 线性 表 中 的 
位 置 只 取决 于 它们 的 序号 ,所 以 在 一 个 线性 表 中 可 以 存在 两 个 值 相同 的 元 素 。 





212 线性 表 的 抽象 数据 类 型 描述 
线性 表 的 抽象 数据 类 型 的 描述 如 下 ， 
ADT List 
《{ 。 数据 对 象 : 


DD={ ai| 1 二 i<n,n 宇 0,a;i 为 ElemType 类 型 } //ElemType 是 自 定义 类 型 标识 符 


EB 
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数据 关系 : 
R= {<ai,ain>| aivaim ED,i=1, -,n—1} 
基本 运算 : 
InitList(&L): 初始 化 线性 表 , 构 造 一 个 空 的 线性 表 工 。 
DestroyList(&&L): 销毁 线性 表 , 释放 线性 表 工 占用 的 内 存 空间 。 
ListEmpty(L): 判断 线性 表 是 否 为 空 表 , 若 工 为 空 表 , 则 返回 真 ,否则 返回 假 。 
ListLength(L): 求 线性 表 的 长 度 , 返 回 工 中 元 素 的 个 数 。 
DispList(L) : 输出 线性 表 , 当 线 性 表 工 不 为 空 时 顺序 显示 工 中 各 结 点 的 值 域 。 
GetElem(L,i, &e): 求 线性 表 中 某 个 数据 元 素 值 ,用 e 返回 L 中 第 i(1<i<n) 个 元 素 的 值 。 
LocateElem(L,e) : 按 元 素 值 查找 ,返回 工 中 第 一 个 值 域 与 。 相等 的 元 素 的 序号 , 若 这 样 的 
元 素 不 存在 , 则 返回 值 为 0。 
ListInsert(&L,i,e): 插入 数据 元 素 , 在 的 第 i(1<i<n 十 1) 个 位 置 插入 一 个 新 的 元 素 ,了 上 
的 长 度 增 1。 
ListDelete(& Li &e) : 删除 数据 元 素 ,删除 工 的 第 i(1 过 i 过 nn) 个 元 素 ,并 用 。 返回 其 值 ,L 
的 长 度 减 1。 
l 


线性 表 的 作用 主要 体现 在 两 个 方面 , 当 一 个 线性 表 实现 后 ,程序 员 可 以 直接 使 用 它 来 存 
放 数 据 , 即 作为 存放 数据 的 容器 ,另外 程序 员 可 以 直接 使 用 它 的 基本 运算 来 完成 更 复杂 的 功 
能 。 线 性 表 基 本 运算 是 与 求解 问题 相关 的 ,上 面 列 出 的 9 个 基本 运算 是 线性 表 最 常用 的 功 
能 ,在 实际 应 用 中 大 家 可 以 根据 需要 进行 增 减 。 

【 例 2.1】 有 一 个 线性 表 工 = 二 (1,3,1,4,2), 求 ListLength (L)、ListEmpty ( 工 )、 
GetElem(L,3,e)、LocateElem(L,1)、ListInsert(L,4,5) 和 ListDelete(L,3) 基 本 运算 依次 
执行 后 的 结果 。 

线性 表 工 中 存放 的 是 几 个 整数 ,其 各 种 基本 运算 的 结果 如 下 。 

ListLength(L) 二 5, 即 线性 表 工 的 长 度 为 5。 

ListEmpty(L) 返 回 false, 即 线性 表 工 为 非 空 表 。 

GetElem(L,3,e) ,e 二 1, 即 线性 表 工 中 的 第 3 个 元 素 是 1。 

LocateElem(L,1) 王 1, 即 线性 表 工 中 第 一 个 值 为 1 的 元 素 的 迎 辑 序号 是 1。 

ListInsert( 工 ,4,5) 是 在 线性 表 工 中 逮 辑 序号 4 的 位 置 插 入 元 素 5 ,执行 后 工 变 为 (1,3， 
和 

ListDelete(L,3,e) 是 在 线性 表 工 中 删除 逻辑 序号 3 的 元 素 ,执行 后 工 变 为 (1,3,5,4,2)。 

【 例 2.2】 假设 有 两 个 集合 A 和 B ,分别 用 两 个 线性 表 LA 和 LB 表示 , 即 线性 表 中 的 
数据 元 素 为 集合 中 的 元 素 。 利 用 线性 表 的 基本 运算 设计 一 个 算法 求 一 个 新 的 集合 C=AU 
B, 即 将 两 个 集合 的 并 集 放 在 线性 表 LC 中 。 

先 初始 化 线性 表 LC, 即 创建 一 个 空 的 线性 表 LC, 将 LA 的 所 有 元 素 复 制 到 LC 中 ， 
然后 扫描 线性 表 LB, 将 LB 中 不 属于 LA 的 元 素 插入 到 LC 中 。LA、LB 和 LC 均 为 List 类 
型 变量 ,假设 List 是 一 个 已 经 实现 了 的 线性 表 数 据 结构 。 对 应 的 算法 如 下 : 


void unionList(List LA, List LB, List &LC) 
{ int lena,i; 
ElemType e; 
TnitList(LC); // 初 始 化 LC 
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for (i=1;i<=ListLength(LA);i 十 十 ) // 将 LA 中 的 所 有 元 素 复制 到 LC 中 
{ GetElem(LA,i,e); // 取 LA 中 的 第 i 个 元 素 赋 给 e 
ListInsert(LC.,i, e); // 将 元 素 e 插 入 到 LC 中 
} 
lena=ListLength(LA); // 求 线性 表 LA 的 长 度 
for (i=1;i<=ListLength(LB) ;i+ 十 ) // 循 环 处 理 LB 的 每 一 个 元 素 
{ GetElem(LB,i,e); // 取 LB 中 的 第 i 个 元 素 赋 给 e 
if (!LocateElem(LA, e)) // 判 断 e 是 否 在 LA 中 
ListInsert(LC, 十 十 lena,e); // 若 e 不 在 LA 中 , 则 将 其 插入 到 LC 中 


} 


在 上 述 算法 中 ,LA 和 LB 是 输入 型 参数 ,而 LC 是 求解 结果 ,为 输出 型 参数 ,所 以 将 LC 
设计 为 引用 型 形 参 。 

从 中 可 以 看 出 , 当 线 性 表 List 实现 以 后 ,可 以 利用 它 作为 存放 集合 数据 的 容器 ,也 可 以 
利用 它 的 基本 运算 完成 更 复杂 的 集合 运算 ,如 求 两 个 集合 的 并 集 等 。 


线性 表 的 顺序 存储 结构 “ 米 


线性 表 的 顺序 存储 结构 是 最 常用 的 存储 方式 , 它 直接 将 线性 表 的 逻辑 结构 映射 到 存储 
结构 上 , 既 便于 理解 ,又 容易 实现 。 本 节 讨论 顺序 存储 结构 及 其 基本 运算 的 实现 过 程 。 
221 线性 表 的 顺序 存储 结构 一 一 顺序 表 

线性 表 的 顺序 存储 结构 是 把 线性 表 中 的 所 有 元 素 按照 其 多 辑 顺 序 依次 
存储 到 从 计算 机 存储 器 中 指定 存储 位 置 开始 的 一 块 连续 的 存储 空间 中 ,如 


图 2.2 所 示 。 由 于 线性 表 中 逻辑 上 相 邻 的 两 个 元 素 在 对 应 的 顺序 表 中 它们 
的 存储 位 置 也 相 邻 ,所 以 这 种 映射 称 为 直接 映射 。 线 性 表 的 顺序 存储 结构 


















































简称 为 顺序 表 (sequential list) 。 的 
顺序 表 
线性 表 直接 映射 0 1 iil nl MaxSize-1 
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data length 


图 2.2 线性 表 到 顺序 表 的 映射 





这 样 ,线性 表 工 中 第 一 个 元 素 的 存储 位 置 就 是 指定 的 存储 位 置 ,第 ;十 1 个 元 素 (1 达 ;过 ~ 


n 一 1) 的 存储 位 置 紧 接 在 第 i 个 元 素 的 存储 位 置 的 后 面 。 假设 线性 表 的 元 素 类 型 为 
ElemType, 则 每 个 元 素 所 占用 存储 空间 的 大 小 ( 即 字 节 数 ) 为 sizeof(ElemType) ,整个 线性 
表 所 占用 存储 空间 的 大 小 为 nX sizeof(ElemType) ,其 中 表示 线性 表 的 长 度 。 

在 C/C++ 语言 中 ,借助 数组 类 型 来 实现 顺序 表 , 也 就 是 说 ,用 数组 存放 线性 表 的 元 素 及 
其 逻辑 关系 ,数组 的 基本 类 型 就 是 线性 表 中 元 素 的 类 型 ,数组 大 小 ( 即 数组 上 界 一 下 界 十 1) 
要 大 于 等 于 线性 表 的 长 度 ,否则 该 数组 不 能 存放 对 应 线性 表 的 所 有 元 素 。 所 以 当 线 性 表 长 
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度 小 于 数组 大 小 时 ,该 数组 中 会 有 一 部 分 空闲 空间 。 
线性 表 中 的 第 一 个 元 素 wa 存储 在 对 应 数组 的 起 始 位 置 , 即 下 标 为 0 的 位 置 上 ,第 二 个 
元 素 a 存储 在 下 标 为 1 的 位 置 上 ,依次 类 推 ,第 i 个 元 素 a; 存 储 在 下 标 为 i 一 1 的 位 置 上 。 
假设 线性 表 工 存储 在 数组 A 中 ,A 的 起 始 存 储 位 置 为 LOC(A), 则 工 所 对 应 的 顺序 表 如 
图 2. 3 所 示 。 需 要 注意 的 是 ,顺序 表 采 用 数组 来 实现 ,但 不 能 将 任何 一 个 数组 都 当 作 是 一 个 
顺序 表 , 二 者 的 运算 是 不 同 的 。 
下 标 位 置 。 ”线性 表 存储 空间 。 存储 地 址 


























0 a LOC() 
1 a LOC(A)+sizeoftElemType) 
1 | Locc)tG 1)xsizeofElemType) 
-1 a LOCCIDH-DXsizeofElemType) 
; LOC(4)+(MaxSize-1D)XsizeofElemType) 


图 2.3 顺序 表 的 示意 图 


数组 大 小 MaxSize 一 般 定义 为 一 个 整 型 常量 。 如 果 估 计 一 个 线性 表 不 会 超过 50 个 元 
素 , 则 可 以 把 MaxSize 定义 为 50， 


# define MaxSize 50 


在 声明 线性 表 的 顺序 存储 类 型 时 ,定义 一 个 data 数组 来 存储 线性 表 中 的 所 有 元 素 , 还 
一 个 整 型 变量 length 来 存储 线性 表 的 实际 长 度 ,并 采用 结构 体 类 型 SqList 表示 如 下 : 


typedef struct 


{ ElemType data[MaxSize] ; // 存 放 线性 表 中 的 元 素 
int length; // 存 放 线 性 表 的 长 度 
} SqList; // 顺 序 表 类 型 


例如 ,对 于 第 1 章 例 1. 1 的 巡 辑 结构 City, 假 设 每 个 元 素 占用 30 个 存储 单元 ,数据 从 
100 号 单元 开始 由 低地 址 向 高 地 址 方向 存储 ,对 应 的 顺序 表 如 图 2. 4 所 示 , 其 中 data 为 包含 
城市 名 、 区 号 和 说 明 数 据 域 的 结构 体 类 型 的 数组 ,该 顺序 表 的 length 域 应 为 5。 











地 址 区 号 城市 名 说 明 

100 010 Beijing 北京 ， 首 都 

130 a Shanghai 海 ， 直 辖 市 
160 7 Wuhan 武汉 ， 湖 北 省 省 会 
190 Xian 了 天 省 竺 会 
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图 2.4 City 对 应 的 顺序 表 结 构 
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222 顺序 表 基 本 运算 的 实现 


一 旦 采用 顺序 表 存 储 结构 ,就 可 以 用 C/C++ 语言 实现 线性 表 的 各 种 基本 运算 。 为 了 简 
单 ,假设 ElemType 为 int 类 型 ,使 用 以 下 自 定义 类 型 语句 : 


typedef int ElemType; 


注意 : 在 后 面 的 算法 中 ,线性 表 元 素 的 逻辑 序号 是 从 1 开始 的 ,而 对 应 顺序 表 的 data[ ] 
数组 下 标 是 从 0 开始 的 (这 种 下 标 称 为 物理 序号 ) ,因此 要 注意 它们 之 间 的 转换 。 

本 节 采 用 顺序 表 指针 方式 建立 和 使 用 顺序 表 , 其 结构 如 图 2. 5(a) 所 示 , 也 可 以 直接 使 
用 顺序 表 Q, 如 图 2.5(b) 所 示 。 

说 明 : 顺序 表 指针 工 和 顺序 表 Q 都 可 以 提供 /一 | 0 
一 个 顺序 表 , 但 前 者 是 通过 指针 工 间接 地 提供 顺序 所 让 才 顺序 表 
表 , 其 定义 方式 为 SqList * 工 ,后 者 是 直接 地 提供 (a) 顺序 表 指 针 志 (b) 顺序 表 O 
顺序 表 , 其 定义 方式 为 SqList Q。 前 者 引用 length 
域 的 方式 为 了 一 > length, 后 者 引用 length 域 的 方 
式 为 Q.length。 之 所 以 采用 顺序 表 指 针 , 主 要 是 为 了 方便 顺序 表 的 释放 算法 设计 ,并 且 在 
函数 之 间 传递 顺序 表 指 针 时 会 节省 为 形 参 分 配 的 空间 。 扫 - 扫 

这 里 介绍 整体 创建 顺序 表 , 即 由 数组 元 素 a[0..n 一 1] 创 建 顺序 表 工 。 
其 方法 是 将 数组 a 中 的 每 个 元 素 依次 放 入 到 顺序 表 中 ,并 将 赋 给 顺序 表 
的 长 度 域 。 算 法 如 下 : 

















图 2.5 顺序 表 指 针 和 顺序 表 

















void CreateList(SqList * &L,ElemType a[] ,int n) // 由 a 中 的 n 个 元 素 建立 顺序 表 


{ int 一 0,k 一 0; //k 表 示 工 中 的 元 素 个 数 ,初始 值 为 0 
L= (SqList * )malloc(sizeof(SqList)); // 分 配 存 放 线 性 表 的 空间 
while (i<n) /Wi 扫描 数组 a 的 元 素 
{ L->data[k]=a[i]; // 将 元 素 a 中 存放 到 工 中 
k++ ; i++; 
} 
L—>length=k; // 设 置 L 的 长 度 k 


} 


当 调 用 上 述 算 法 创建 好 工 所 指 的 顺序 表 后 ,需要 回 传 给 对 应 的 实 参 ,也 就 是 说 ,L 是 输 
出 型 参数 ,所 以 在 形 参 工 的 前 面 需 要 加 上 引用 符 * &”。 
2" 顺序 表 若 术 运 算 算 状 














1) 初始 化 线性 表 InitList(&L) 
该 运算 的 功能 是 构造 一 个 空 的 线性 表 工 ,实际 上 只 需 分 配 线性 表 的 存 
储 空间 并 将 length 域 设置 为 0 即 可 。 算 法 如 下 : 














void InitList(SqList * &L) 
{ LL=(SqList * )malloc(sizeof(SqList) ) ; // 分 配 存 放 线性 表 的 空间 
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L ->length=0; // 置 空 线性 表 的 长 度 为 0 


本 算法 的 时 间 复 杂 度 为 O(1) 。 
2) 销毁 线性 表 DestroyList(&L) 
该 运算 的 功能 是 释放 线性 表 工 占用 的 内 存 空间 。 算 法 如 下 : 


void DestroyList(SqList * &L) 
{ 

free(L); // 释 放 世 所 指 的 顺序 表 空 间 
} 


本 节 的 顺序 表 是 通过 malloc 函数 分 配 存储 空间 的 , 当 不 再 需要 顺序 表 时 务必 调用 
DestroyList 基本 运算 释放 其 存储 空间 ; 否则 ,尽管 系统 会 自动 释放 顺序 表 指 针 变量 工 ,但 不 会 
自动 释放 工 所 指向 的 存储 空间 ,如 此 可 能 会 造成 内 存 泄漏 。 本 算法 的 时 间 复 杂 度 为 O(1) 。 

3) 判断 线性 表 是 否 为 空 表 ListEmpty(L) 

该 运算 返回 一 个 布尔 值 表示 工 是 否 为 空 表 。 若 工 为 空 表 , 则 返回 true', 和 否则 返回 false。 
算法 如 下 : 


bool ListEmpty(SqList * L) 
{ 

return(L -> length==0); 
} 


本 算法 的 时 间 复 杂 度 为 0(1) 。 

4) 求 线 性 表 的 长 度 ListLength(L) 

该 运算 返回 顺序 表 工 的 长 度 ,实际 上 只 需 返回 length 域 的 值 即 可 。 算 法 如 下 : 
int ListLength(SqList * L) 

{ 


return(L —> length) ; 
} 


本 算法 的 时 间 复 杂 度 为 OC1) 。 
5) 输出 线性 表 DispList(L) 
该 运算 依次 显示 工 中 各 元 素 的 值 。 算 法 如 下 : 





void DispList(SqList * L) 
{ for (inti=0;i<L—>length;i+ 十 ) // 扫 描 顺 序 表 输出 各 元 素 值 
printf("%d ",L —> data[]); 
printf("\n"); 
} 


本 算法 中 的 基本 操作 为 for 循环 中 的 printf 语句 , 它 执行 n 次 , 故 时 间 复 杂 度 为 O(n)， 
其 中 为 顺序 表 中 元 素 的 个 数 。 


_ BO 





6) 求 线性 表 中 的 某 个 数据 元 素 值 GetElem(L ,i,&e) 
该 运算 用 引用 型 参数 e 返回 工 中 第 ;1 入 i 委 四 个 元 素 的 值 。 算 法 如 下 : 


bool GetElem(SqList * L,int i,ElemType &e) 
{ ifCi<l | i>L 一 length) 


return false; // 参 数 i 错误 时 返回 false 
e=L —> data[i—1]; // 取 元 素 值 
return true; // 成 功 找到 元 素 时 返回 true 
} 
本 算法 的 时 间 复 杂 度 为 0(1)。 


7) 按 元 素 值 查找 LocateElem(L ,e) 
该 运算 顺序 查找 第 一 个 值 域 与 e 相等 的 元 素 的 逻辑 序号 (找到 后 返回 一 个 大 于 0 的 
值 ) , 若 这 样 的 元 素 不 存在 , 则 返回 值 为 0。 算 法 如 下 : 


int LocateElem(SqList * L, ElemType e) 


© inti=08 
while (i<L—>length && L —> data[i] !=e) 
La // 查 找 元 素 e 
if (i>=L ~> length) // 未 找到 时 返回 0 
return 0; 
else 
return i 十 1; // 找 到 后 返回 其 逻辑 序号 


} 


本 算法 中 的 基本 操作 为 while 循环 中 的 i 十 十 语句 ,其 平均 执行 (n 十 1)/2 次 , 故 时 间 复 
杂 度 为 O(n) ,其 中 ”为 顺序 表 中 元 素 的 个 数 。 

8) 插入 数据 元 素 Listlnsert(&L ,i,e) 

该 运算 在 顺序 表 工 的 第 i(1 志 i 十 1) 个 位 置 上 插入 新 元 素 。。 如 果 i 值 不 正确 ,返回 
false; 否则 将 顺序 表 原 来 的 第 i 个 元 素 及 以 后 的 元 素 均 后 移 一 个 位 置 ,并 从 最 后 一 个 元 素 
a 开始 移动 起 ,如 图 2. 6 所 示 , 腾 出 一 个 空位 置 插入 新 元 素 ,最 后 顺序 表 的 长 度 增 1 并 返回 
true。 算 法 如 下 : 


bool ListInsert(SqList * &L,int i,ElemType e) 





{intjs 

if (i<1 | i>L 一 length 十 1) 
return false; // 参 数 i 错误 时 返回 false 

a // 将 顺序 表 逻 辑 序号 转化 为 物理 序号 

for (=L—> length;j>i;j——) // 将 data[ 癌 及 后 面 的 元 素 后 移 一 个 位 置 I 
L—> data0] =L—> dataD—1]; 

L -> data[] =e; // 插 入 元 素 e 

L 一 length 十 十 ; // 顺 序 表 长 度 增 1 

return true; // 成 功 插入 返回 true 


} 


对 于 本 算法 来 说 ,元 素 移动 的 次 数 不 仅 与 表 长 ==L 一 > length 有 关 , 而 且 与 插入 位 置 ; 
有 关 , 共 有 nn 十 1 个 可 以 插入 元 素 的 地 方 : 当 i 二 n 十 1 时 (插入 在 末尾 ) ,移动 次 数 为 0; 当 








i … nl … MaxSize-l length 
2 2 n 增 1 






































从 右 向 左 进行 
图 2. 6 插入 元 素 时 移动 元 素 的 过 程 





i 二 1 时 (插入 在 开头 ) ,移动 次 数 为 n, 达 到 最 大 值 ; 一 般 需 要 将 ai 一 ao 的 元 素 均 后 移 一 个 位 
置 ,移动 次 数 为 "一 ;十 1。 假 设 p; 是 在 第 i 个 位 置 上 插入 一 个 元 素 的 概率 ,在 等 概率 的 情况 


下 ,pi 一 -十 , 则 在 长 度 为 的 线性 表 中 插入 一 个 元 素 时 所 需 移 动 元 素 的 平均 次 数 为 
n+1 nn 十 1 +1 


Pe 1 1 
Sp i 二 1) ii” i 二 1) iFi i 十 1) 


1 x n+ 1) 三 环 
红叶 1 2 2 


该 算法 的 主要 时 间 都 是 花费 在 元 素 的 移动 上 ,因此 插入 算法 的 平均 时 间 复 杂 度 为 O(n)。 

9) 删除 数据 元 素 ListDelete(&L ,i.,&e) 

该 运算 删除 顺序 表 工 的 第 i(1 志 i 个 元 素 。 如 果 i 值 不 正确 ,返回 false; 否则 将 线 
性 表 第 i 个 元 素 以 后 的 元 素 均 向 前 移动 一 个 位 置 ,并 从 元 素 w+ 开始 移动 起 ,如 图 2.7 所 
示 , 这 样 覆盖 了 原来 的 第 ;个 元 素 , 达 到 了 删除 该 元 素 的 目的 ,最 后 顺序 表 的 长 度 减 1 并 返 
回 true。 算 法 如 下 : 











bool ListDelete(SqList * &L,int i,ElemType &e) 






































{ intj; 
it (i<1 | i>L—> length) // 参 数 i 错误 时 返回 false 
return false; 
| // 将 顺序 表 逻 辑 序号 转化 为 物理 序号 
e=L -> data[1] ; 
for (j=i;j<L 一 length 一 1;j 十 十 ) // 将 data 趾 之 后 的 元 素 前 移 一 个 位 置 
L—> dataD]=L -> dataD 十 可; 
L ->length——; // 顺 序 表 的 长 度 减 1 
return true; // 成 功 删除 返回 true 
. 
0 1 2 i nl … MaxSize-l length 
alal|la aa i n 减 1 | 
< 心包 心包 


从 左 向 右 进行 
2.7 删除 元 素 时 移动 元 素 的 过 程 
对 于 本 算法 来 说 ,元 素 移动 的 次 数 也 与 表 长 一 工 一 > length 和 删除 元 素 的 位 置 i 有 


关 , 共 及 个 元 素 可 以 被 删除 : 当 i 二 =n 时 (删除 未 尾 元 素 ) ,移动 次 数 为 0; 当 i 二 1 时 ( 删 
除开 头 元 素 ) ,移动 次 数 为 n 一 1; 一 般 需 要 将 a;+1 ~~a, 的 元 素 均 前 移 一 个 位 置 ,移动 次 数 


@00,EEE 和 i 





为 n 一 (i 十 1) 十 1 二 n 一 i。 假设 p; 是 删除 第 i 个 位 置 上 元 素 的 概率 ,在 等 概率 的 情况 下 , 户 一 
革 , 则 在 长 度 为 n 的 线性 表 中 删除 一 个 元 素 时 所 需 移动 元 素 的 平均 次 数 为 


a a 1 >'ow i) Lx ee 
该 算法 的 主要 时 间 都 是 花费 在 元 素 的 移动 上 ,因此 删除 算法 的 平均 时 间 复 杂 度 为 
ij 


顺序 表 是 最 常见 的 数据 存储 结构 ,除了 基本 运算 以 外 ,下 面 通过 一 些 示 例 介绍 比较 通用 
的 顺序 表 算 法 设计 方法 。 

【 例 2.3】 假设 一 个 线性 表 采 用 顺序 表 表示 ,设计 一 个 算法 ,删除 其 中 所 有 值 等 于 xz 的 
元 素 ,要 求 算法 的 时 间 复 杂 度 为 O(n) ,空间 复杂 度 为 0(1)。 

这 里 提供 两 种 解法 。 

解法 一 : 设 删除 工 中 所 有 值 等 于 xz 元 素 后 的 顺序 表 为 L1, 显 然 L1 包 ， 入- 
含 在 工 中 ,为 此 Ll 重用 工 的 空间 。 扫 描 顺 序 表 工 ,重建 工 只 包含 不 等 于 x | 妨 
的 元 素 ( 类 似 整体 创建 顺序 表 的 过 程 ) ,算法 过 程 是 置 k=0Ck 用 于 记录 新 表 
中 的 元 素 个 数 ) ,用 ;从 左 到 右 扫 描 二 中 的 所 有 元 素 , 当 i 指向 的 元 素 为 x 加 | 
时 跳 过 它 ; 否则 将 其 放置 在 & 的 位 置 , 即 工 一 > data[A] 一 工 一 > data[ 门 ， 入 
k 十 十 。 算 法 如 下 : 
































void delnodel (SqList * &L,ElemType x) 
{ intk=0,i; /人 k 记录 不 等 于 x 的 元 素 的 个 数 , 即 要 插入 到 L 中 的 元 素 个 数 
for (i=0;i<L 一 1length;i 十 十 ) 
让 (L->data 中 !=x) ”// 若 当前 元 素 不 为 x, 将 其 插 人 到 L 中 
{ L->data[lk]=L—> data[i]; 
| // 插 入 一 个 元 素 时 元 素 的 个 数 增 1 
} 
L—>length=k; // 顺 序 表 工 的 长 度 等 于 k 
} 


解法 二 : 扫描 顺序 表 工 ,用 i 从 左 到 右 扫 描 L 中 的 所 有 元 素 , 用 记录 L 中 当前 等 于 xz 
的 元 素 的 个 数 ,一边 扫 描 工 一 边 统计 当前 人 值 。 当 i 指向 的 元 素 为 xz 时 k 增 1; 否则 将 不 为 x 
的 元 素 前 移 个 位 置 , 即 工 一 > data[i 一 币 =L 一 > data[ 门 。 最 后 修改 工 的 长 度 。 算 法 如 下 : 





void delnode2(SqList * &L,ElemType x) 


{ intk 一 0,i 一 0; //kk 记 录 等 于 x 的 元 素 的 个 数 
while (i< 工 一 length) 
{ if(L->data[]==x) // 当 前 元 素 为 x 时 上 k 增 1 
| 可 面 到 
else // 当 前 元 素 不 为 x 时 将 其 前 移 k 个 位 置 
L—>data[i—k]=L 一 data[] ; 
Fs 
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L ->length—=k; // 顺 序 表 的 长 度 递减 上 
} 


上 述 两 种 算法 中 都 只 扫描 顺序 表 一 次 ,时 间 复 杂 度 为 O(n) ,只 有 两 个 临时 变量 ,所 以 空 
间 复 杂 度 为 0(1) ,满足 题目 的 要 求 。 

下 面 两 种 解法 都 不 满足 题目 的 要 求 : 

(1) 每 次 删除 一 个 等 于 xz 的 元 素 时 都 进行 元 素 移动 ,此 时 算法 的 时 间 复 杂 度 为 O(n? )、 
空间 复杂 度 为 0(1)。 

(2) 在 算法 中 临时 新 建 一 个 顺序 表 用 于 存放 不 等 于 z 的 元 素 , 通 过 扫描 原来 的 顺序 表 
得 到 该 新 的 顺序 表 , 此 时 算法 的 时 间 复 杂 度 为 O07) 、 空 间 复杂 度 为 O(n)。 

【 例 2.4】 有 一 个 顺序 表 工 ,假设 元 素 类 型 ElemType 为 整 型 ,设计 一 个 尽 可 能 高 效 的 
算法 ,以 第 一 个 元 素 为 分 界线 (基准 ) ,将 所 有 小 于 等 于 它 的 元 素 移 到 该 基准 的 前 面 ,将 所 有 
大 于 它 的 元 素 移 到 该 基准 的 后 面 。 扫 - 扫 

国 基本 思路 是 以 第 一 个 元 素 为 基准 ,从 右 向 左 找 一 个 小 于 等 于 基准 的 “ 回 
元 素 z, 从 左 向 右 找 一 个 大 于 基准 的 元 素 ,将 两 者 交换 ,直到 全 部 找 完 。 下 
面 提 供 两 种 解法 。 Et 

解法 一 : 用 pivot 存放 基准 , 即 工 一 > dataL0],i( 初 值 为 0) 从 左 向 右 扫 视频 讲解 
描 ,j( 初 值 为 L 一 > length 一 1) 从 右 向 左 扫描 。 当 i 去 j 时 循环 ( 即 循环 到 i 和 j 指向 同一 元 
素 时 为 止 ) : j 从 右 向 左 找 一 个 小 于 等 于 pivot 的 元 素 data[j],i 从 左 向 右 找 一 个 大 于 pivot 
的 元 素 data[ 门 ,然后 将 data[ 门 和 data[ 门 进行 交换 。 当 循环 结束 后 再 将 data[0] 和 data[ 门 
进行 交换 。 算 法 如 下 : 













Ck 








int partitionl (SqList * &L) 
{ inti=0,j=L —> length—1; 






































ElemType pivot=L -> data[0] ; // 以 data[0] 为 基准 
while (i<j) // 从 区 间 两 端 交 替 向 中 间 扫 描 , 直 到 i=j 为 止 
{while (i<j && L—> data[j]> pivot) 
1 一 // 从 右 向 左 扫描 , 找 一 个 小 于 等 于 pivot 的 元 素 
while (i<j && L—> data[i]<= pivot) 
间 才 让 // 从 左 向 右 扫描 , 找 一 个 大 于 pivot 的 元 素 
if (i<j) 
swap(L -> data[ 中 ,L 一 > data[]); // 将 L->data[ 中 和 L 一 > data0] 进 行 交换 
} 
swap(L —> data[0] ,L 一 data[]); // 将 LL 下 data[0] 和 ->data[ 进 行 交换 
} 
例如 ,车 顺序 表 工 为 (|3|,8,2,7,1,5,3,4,6,0) ,执行 上 述 算法 后 工 变 为 (1,0,2,3,|3|， 
5,7,4,6,8) ,其 执行 过 程 如 图 2. 8 所 示 。 一 共 经 过 3 轮 循环 ,其 中 |3| 是 基准 ,在 算法 执行 后 
对 应 的 下 标 为 4。 


解法 二 : 用 pivot 存放 基准 , 即 工 一 > data[0],i( 初 值 为 0) 从 左 向 右 查 找 ,j( 初 值 为 L 一 > 
length 一 1) 从 右 向 左 查找 。 当 ij 时 循环 : j 从 右 向 左 找 一 个 小 于 等 于 pivot 的 data[ 站 , 找 
到 后 将 data[j] 放 到 data[ 门 处 (用 data[j] 覆 盖 data[i]) ,i 从 左 向 右 找 一 个 大 于 pivot 的 记 
录 data[i] ,找到 后 将 data[Lz] 放 到 data[j 处 (用 data[ 门 柳 盖 data[j])。 最 后 让 data[i 二 
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pivot。 算 法 如 下 : 


void partition2(SqList * &L) 
{ int 一 0,j 王 L 一 > length 一 1; 
ElemType pivot=L 一 data[0] ; // 以 data[0] 为 基准 


while (i<j) 


{ while (j>i && L—> data[j]> pivot) 


| 
L—>data[i] =L 一 data[)] ; // 找 到 这 样 的 data[j] , 放 入 data 丫 处 
while (i<j && L—> data[i]<= pivot) 


ry 


L—>data[] =L —> data[i] ; // 找 到 这 样 的 data 口 , 放 入 data 中 处 


} 


L -> data[i] = pivot; 


} 


例如 ,车 顺序 表 工 为 ( 


7,4,6,8) ,其 执行 过 程 如 图 2.9 所 示 。 同 样 需要 3 轮 循环 ,其 中 | 引 是 基准 ,在 算法 执行 后 对 


应 的 下 标 为 4。 


尽管 对 于 同一 个 数据 序列 ,这 两 个 算法 的 执行 结果 不 完全 相同 ,但 都 能 满足 题目 要 求 ， 








3 








图 2.8 movel 算法 的 执行 过 程 


// 从 顺序 表 两 端 交 蔡 向 中 间 扫 描 , 直 到 i 一 j 为 止 


// 从 右 向 左 扫描 , 找 一 个 小 于 等 于 pivot 的 dataD] 


// 从 左 向 右 扫描 , 找 一 个 大 于 pivot 的 记录 data[j 








,8,2,7,1,5,3,4,6,0) ,执行 上 述 算法 后 工 为 (0,3,2,1,|3|,5， 























而 且 它们 的 时 间 复 杂 度 均 为 O(n) 、 空 间 复杂 度 均 为 0(1) ,都 属于 高 效 算法 。 

但 比较 而 言 ,第 2 个 算法 中 移动 元 素 的 次 数 更 少 ,所 以 算法 更 优 。 这 是 因为 在 交换 两 个 
元 素 ab 时 ,车 通过 语句 “tmp 一 a; a 二 b; b 二 tmp;” 来 实现 ,需要 移动 3 次 元 素 。 

如 果 需 要 多 次 连续 交换 两 个 相 邻 元 素 ,例如 将 a、b、c 转换 为 bc、a( 即 循环 左 移 一 个 元 
素 ) , 若 先 将 位 置 1 和 位 置 2 的 元 素 交 换 得 到 b、a、c, 需 移动 3 次 ,再 将 位 置 2 和 位 置 3 的 元 
素 交换 得 到 b、c、a. 需 移动 3 次 ,这 样 一 共 移 动 6 次 。 而 采用 “tmp 二 a; a 二 b; b==c; c 二 tmp;”， 
同样 满足 要 求 , 但 一 共 只 需要 移动 4 次 ,所 以 性 能 得 到 提高 。 在 上 述 两 个 算法 中 ,第 1 个 算 
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图 2.9 move2 算法 的 执行 过 程 


法 采用 的 是 前 一 种 方法 ,第 2 个 算法 采用 的 是 后 一 种 方法 的 思路 。 

本 例 算法 实际 上 是 第 10 章 10. 3. 2 节 介 绍 的 快速 排序 的 划分 过 程 ,主要 采用 第 2 种 解 
法 ,读者 掌握 它 对 于 理解 快速 排序 过 程 有 很 大 的 帮助 。 

【 例 2.5】 有 一 个 顺序 表 工 ,假设 元 素 类 型 ElemType 为 整 型 ,设计 一 个 尽 可 能 高 效 的 
算法 ,将 所 有 奇数 移动 到 偶数 的 前 面 。 

这 里 提供 两 种 解法 。 

解法 一 : 类 似 例 2. 4 解法 一 的 思路 。i( 初 值 为 0) 从 左 向 右 扫 描 ,j( 初 值 为 L 一 > length 一 1) 
从 右 向 左 扫描 。 当 ij 时 循环 : j 从 右 向 左 找 一 个 奇数 元 素 data[jj],i 从 左 向 右 找 一 个 偶 
数 元 素 data[ 疏 ,然后 在 i<j 时 将 两 者 交换 ,从 而 把 所 有 奇数 移动 到 偶数 的 前 面 。 算 法 如 下 : 





void movel (SqList * &L) 
{ inti=0,j=L—> length—1; 
while (i<j) 


{ while (i<j && L—>data[]%2==0) 


= // 从 右 向 左 扫描 , 找 一 个 奇数 元 素 
while (i<j && L 一 data[i] %2==1) 
局 二 // 从 左 向 右 扫 描 , 找 一 个 偶数 元 素 
if (i<)) // 车 i<j, 将 L->data[ 中 和 L -> data 中 交换 


swap(L -> data[i] ,L —> dataD] ); 


} 


解法 二 : 用 工 一 > data[0.. 站 表示 存放 奇数 的 奇数 区 间 (i 指向 奇数 区 间 中 的 最 后 元 素 )， 


如 图 2. 10 所 示 ,初始 时 i 为 一 1 表示 奇数 区 间 为 空 。 下 标 0 … 1 1 
7 从 左 向 右 扫 描 所 有 元 素 , 如 果 j 指向 的 元 素 是 奇数 ， Ci | 











让 i 增 1 表示 奇数 区 间 多 了 一 个 奇数 ,然后 将 “一 -一 
工 一 > data[ 门 和 工 一 > data[ 门 交换 ,j 继续 扫 措 。 循 人 
环 结束 后 ,奇数 区 间 包 含 了 所 有 的 奇数 , 剩 下 的 所 有 图 2.10 奇数 区 间 


偶数 放 在 后 面 。 算 法 如 下 : 


void move2(SqList * &L) 


{ inti=—1,j; 
for (j=0;j<=L —> length 一 1;j 十 十 ) 
if (L —> data0] %2==1) /Vi 指向 奇数 时 
Co Ls // 奇 数 区 间 个 数 增 1 
让 (il 一 // 著 i 不 为 j, 将 -> data[ 中 和 > data 中 交换 


swap(L —> data[] ,L —> data[)]); 


b 


上 述 两 个 算法 的 时 间 复 杂 度 为 O(n) 、 空 间 复杂 度 为 O(1) ,都 属于 高 效 的 算法 。 


线性 表 的 链 式 存储 结构 





顺序 表 必 须 占 用 一 整 块 事先 分 配 大 小 的 存储 空间 ,这 样 会 降低 存储 空间 的 利用 率 ,为 此 
有 了 可 以 实现 存储 空间 动态 管理 的 链 式 存储 结构 一 一 链表 。 本 节 讨论 链 式 存储 结构 及 其 基 
本 运算 的 实现 过 程 。 汪汪 


231 线性 表 的 链 式 存储 结构 一 一 链表 


线性 表 的 链 式 存 储 结构 称 为 链表 (linked list) 。 其 中 每 个 存储 结 点 不 仅 包 二 
含 元 素 本 身 的 信息 ( 称 为 数据 域 ) ,而 且 包含 表示 元 素 之 间 逮 辑 关系 的 信息 ,在 C/C++ 语言 
采用 指针 来 实现 ,这 称 为 指针 域 。 

由 于 线性 表 中 的 每 个 元 素 最 多 只 有 一 个 前 驱 元 素 和 一 个 后 继 元 素 , 所 以 当 采 用 链 式 存 
储 时 ,一 种 最 简单 .最 常用 的 方法 是 在 每 个 结 点 中 除 包 含有 数据 域 以 外 只 设置 一 个 指针 域 ， 
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用 于 指向 其 后 继 结 点 ,这 样 构成 的 链表 称 为 线性 单 向 链接 表 , 简 称 单 链表 (singly linked 
list); 另 一 种 可 以 采用 的 方法 是 在 每 个 结 点 中 除 包 含有 数值 域 以 外 设置 两 个 指针 域 ,分 别 
用 于 指向 其 前 驱 结 点 和 后 继 结 点 ,这 样 构成 的 链表 称 为 线性 双向 链接 表 , 简称 双 链 表 
(doubly linked list) 。 若 一 个 结 点 中 的 某 个 指针 域 不 需要 指向 其 他 任何 结 点 , 则 将 它 的 值 置 
为 空 ,用 常量 NULL 表示 。 

在 线性 表 的 链 式 存储 中 ,通常 每 个 链表 带 有 一 个 头 结 点 ,并 通过 头 结 点 的 指针 唯一 标识 
该 链表 , 称 之 为 头 指 针 (head pointer) ,相应 的 指向 首 结 点 或 者 开始 结 点 的 指针 称 为 首 指 针 
(first pointer) ,指向 尾 结 点 的 指针 称 为 尾 指 针 (tail pointer) 。 

从 一 个 链表 的 头 指针 所 指 的 头 结 点 出 发 , 沿 着 结 点 的 链 ( 即 指针 域 的 值 ) 可 以 访问 到 每 
个 结 点 。 如 图 2. 11 所 示 ,图 2. 11(a) 是 带头 结 点 的 单 链表 head, 图 2. 11(b) 是 带头 结 点 的 双 
链表 dhead ,分 别称 为 head 单 链表 和 dhead 双 链 表 。 
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图 2.11 链表 示意 图 















































例如 ,对 于 第 1 章 中 例 1. 1 的 多 辑 结 构 City, 采 用 带头 结 点 的 单 链表 存储 时 的 结构 如 
图 2.12 所 示 , 即 对 应 图 2. 13 所 示 的 示意 图 ,这 时 p 二 70 作为 头 结 点 的 地 址 。 其 中 数据 域 包 
含 区 号 ,城市 名 和 说 明 等 信息 。 


在 顺序 表 中 , 修 辑 上 相 邻 的 元 素 对 应 的 存储 位 置 也 相 邻 ,所 以 当 进 行 插入 或 删除 操 
作 时 通常 需要 平均 移动 半 个 表 的 元 素 ,这 是 相当 费时 的 操作 。 在 链表 中 ,人 逻辑 上 相 邻 的 
元 素 对 应 的 存储 位 置 是 通过 指针 来 链接 的 ,因而 每 个 结 点 的 存储 位 置 可 以 任意 安排 ,不 
必要 求 相 邻 , 所 以 当 进 行 插入 或 删除 操作 时 只 需要 修改 相关 结 点 的 指针 域 即 可 ,这 样 既 
方便 又 省 时 。 
正 因为 顺序 表 是 线性 表 的 直接 映射 ,所 以 具有 随机 存 取 特性 , 即 查 找 第 i 个 (序号 ) 元 素 
对 应 的 时 间 复 杂 度 为 0(1) ,而 链表 不 具有 随机 存 取 特 性 。 





CA2 人 线性 表 | 





地 址 区 号 城市 名 说 明 下 一 个 结 点 地 址 
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100 Beijing 北京 ， 首 








180 Nanjing 南京 ， 江 苏 省 省 会 





250 Xian 安 ， 陕 西 省 省 会 








310 Wuhan 式 汉 ， 湖 北 省 省 会 








460 Shanghai - 海 ， 直 辖 市 
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图 2.13 City 对 应 的 单 链表 存储 结构 示意 图 


另外 ,顺序 表 的 存储 密度 比较 高 。 所 谓 存储 密度 (storage density) 是 指 结 点 中 数据 元 素 
本 身 所 占 的 存储 量 和 整个 结 点 占用 的 存储 量 之 比 , 即 

一 般 情 况 下 ,存储 密度 越 大 ,存储 空间 的 利用 率 越 高 。 显 然 , 顺 序 表 的 存储 密度 为 1( 顺 
序 表 中 没有 指针 域 , 每 个 顺序 表 元 素 存 放 一 个 线性 表 元 素 ), 而 链表 的 存储 密度 小 于 1。 例 
如 , 若 单 链 表 的 结 点 数据 均 为 整数 ,指针 所 占 的 空间 大 小 和 整数 元 素 所 占 的 空间 大 小 相同 ， 
则 单 链表 的 存储 密度 为 50% 。 扫 -- 扫 


232 单 链 表 
在 单 链表 中 ,假设 每 个 结 点 的 类 型 用 LinkNode 表示 , 它 应 包括 存储 元 














素 的 数据 域 ,这 里 用 data 表示 ,其 类 型 用 通用 类 型 标识 符 ElemType 表示 ， 有 F ~ 


还 包括 存储 后 继 结 点 位 置 的 指针 域 ,这 里 用 next 表示 。LinkNode 类 型 的 声明 如 下 : 


typedef struct LNode 

{ ElemType data; // 存 放 元 素 值 
struct LNode * next; // 指 向 后 继 结 点 

} LinkNode; // 单 链表 结 点 类 型 
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为 了 简单 ,假设 ElemType 为 int 类 型 ,使 用 以 下 自 定义 类 型 语句 : 


typedef int ElemType; 


在 后 面 的 算法 设计 中 ,如 果 没 有 特别 说 明 , 均 采用 带头 结 点 的 单 链表 ,在 单 链表 中 增加 
一 个 头 结 点 的 优点 如 下 : 

(1) 单 链 表 中 首 结 点 的 插入 和 删除 操作 与 其 他 结 点 一 致 ,无 须 进行 特殊 处 理 。 

(2) 无 论 单 链 表 是 否 为 空 都 有 一 个 头 结 点 ,因此 统一 了 空 表 和 非 空 表 的 处 理 过 程 。 

在 单 链表 中 ,由 于 每 个 结 点 只 包含 有 一 个 指向 后 继 结 点 的 指针 ,所 以 当 访 问 过 一 个 结 点 
后 只 能 接着 访问 它 的 后 继 结 点 ,而 无 法 访问 它 的 前 驱 结 点 ,因此 在 进行 单 链表 结 点 的 插入 和 
删除 时 就 不 能 简单 地 只 对 该 结 点 进行 操作 ,还 必须 考虑 其 前 后 的 结 点 。 

和 

在 单 链表 中 ,插入 和 删除 结 点 是 最 常用 的 操作 ,是 建立 单 链表 和 相关 基本 运算 算法 的 
基础 。 

1) 插入 结 点 的 操作 

这 里 插入 指 在 单 链表 的 两 个 数据 域 分 别 为 a 和 2 的 结 点 (已 知 & 结 点 的 指针 之) 之 间 插 
入 一 个 数据 域 为 zx 的 结 点 (由 s 指向 它 ), 如 图 2. 14(a) 所 示 。 其 操作 是 首先 让 z 结 点 的 指 
针 域 (* 一 > next) 指 向 和 结 点 (p 一 > next) ,然后 让 a 结 点 的 指针 域 (p 一 > next) 指 向 工 结 点 
(3) ,从 而 实现 3 个 结 点 之 间 逻 辑 关 系 的 变化 ,插入 过 程 如 图 2.14(b) 和 (c) 所 示 , 图 2. 14(d) 
是 插入 后 的 结果 。 





























(a) 插入 前 (b) s->next=p->next; 
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(c) p->next=s; (d) 插入 后 
2. 14 在 单 链表 中 插 人 结 点 的 过 程 

















说 明 : 为 了 描述 简单 ,在 链 式 存储 结构 中 由 指针 p 所 指向 的 结 点 称 为 结 点 或 者 


上 述 指 针 修改 用 C/C++ 语句 描述 如 下 : 


s—>next=p—> next; 
p>next=s; 


注意 : 这 两 个 语句 的 顺序 不 能 颠倒 ,否则 先 执 行 “p 一 > next 一 s;” 语 和 句 , 指 向 6b 结 点 的 指 
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针 就 不 存在 了 ,再 执行 “s 一 > next 一 p 一 > next;” 语 和 句 , 相 当 于 执行 “s 一 > next 一 si”, 这 样 插 
入 操作 错误 。 

所 以 在 单 链表 中 插入 一 个 新 结 点 需要 找到 插入 后 的 前 驱 结 点 。 

2) 删除 结 点 的 操作 

这 里 删除 指 在 单 链表 中 删除 结 点 p 的 后 继 结 点 ,如 图 2. 15(a) 所 示 ,删除 2 结 点 的 操作 
是 让 a 结 点 的 指针 域 (p 一 > next) 指 向 c 结 点 (Pp 一 > next 一 > next) ,其 过 程 如 图 2.15(b) 所 
示 。 上 述 指 针 修 改 用 C/C++ 语句 描述 如 下 : 


P -> next 一 p 一 next—> next 
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p Pp 

\ | 1 
…=[o[ 十 国 图 -[ 14 … 辆 天 -1 二 … 
(a) 删除 前 (b) 删除 后 

图 2.15 在 单 链表 中 删除 结 点 的 过 程 



































所 以 在 单 链表 中 删除 一 个 结 点 需要 找到 其 前 驱 结 点 。 
一 般 情 况 下 ,在 删除 一 个 结 点 后 还 需要 释放 其 存储 空间 ,实现 删除 上 述 5 结 点 并 释放 其 
存储 空间 的 语句 描述 如 下 : 


q 一 p 一 > next; //q 临时 保存 被 删 结 点 
p 一 > next 一 q 一 > next; // 从 链表 中 删除 结 点 q 
free(q); // 释 放 结 点 q 的 空间 








这 里 介绍 整体 创建 单 链表 , 即 由 数组 元 素 a[0..n 一 1] 创 建 单 链表 工 。 
整体 建立 单 链表 的 常用 方法 有 以 下 两 种 。 

1) 头 插 法 

该 方法 从 一 个 空 表 开始 依次 读 取 数组 a 中 “ 
的 元 素 , 生 成 一 个 新 结 点 (由 s 指向 它 ), 将 读 取 的 ”区 有 二 = 村-~… 一 [Le 和 
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数组 元 素 存放 到 该 结 点 的 数据 域 中 ,然后 将 其 插入 但 搬入 :snexL >next: L->nexrs; 
到 当前 链表 的 表 头 上 ( 即 头 结 点 之 后 ) ,如 图 2. 16 

所 示 ,直到 数组 a 的 所 有 元 素 读 完 为 止 。 采 用 头 

插 法 建 表 的 算法 如 下 : 


2.16 将 * 所 指 结 点 插入 到 表 头 
void CreateListF (LinkNode * &L, ElemType a[],int n) 
{ LinkNode *s; 
L= (LinkNode * )malloc(sizeof(LinkNode)); 


L->next=NULL; // 创 建 头 结 点 ,其 next 域 置 为 NULL 
for (int i=0;i<n;it 二 ) // 循 环 建立 数据 结 点 s 
{ s=(LinkNode * )malloc(sizeof(LinkNode)); 

s—> data=a[]; // 创 建 数据 结 点 s 


数据 结构 教程 \ 目 GOG 





5 一 > next=L -> next; // 将 结 点 s 插 和 人 到 原 首 结 点 之 前 、 头 结 点 之 后 


L- -> mxt=s 
} 


本 算法 的 时 间 复 杂 度 为 O(n) ,其 中 ?为 单 链表 中 数据 结 点 的 个 数 。 
车 数组 a 包含 4 个 元 素 1.2.3 和 4, 则 调用 CreateListF(L,a,4) 建 立 的 单 链 表 如 图 2. 17 所 
示 , 所 以 在 采用 头 插 法 建 表 时 单 链表 中 数据 结 点 的 顺序 与 数组 a 中 元 素 的 顺序 相反 。 


图 2.17 一 个 单 链表 LL 











2) 尾 插 法 

该 方法 从 一 个 空 表 开始 依次 读 取 数 组 a 中 的 元 素 , 生 成 一 个 新 结 点 ,将 读 取 的 数组 元 
素 存放 到 该 结 点 的 数据 域 中 ,然后 将 其 插入 到 当前 链表 的 表 尾 上 ,如 图 2. 18 所 示 ,直到 数组 
a 的 所 有 元 素 读 完 为 止 。 为 此 需要 增加 一 个 尾 指针 ,使 其 始终 指向 当前 链表 的 尾 结 点 ,每 
搬入 一 个 新 结 点 后 让 指向 这 个 新 结 点 ,最 后 还 需要 将 -所 指 结 点 ( 尾 结 点 ) 的 next 域 普 为 
空 。 采 用 尾 插 法 建 表 的 算法 如 下 : 


void CreateListR(LinkNode * &L,ElemType a[] ,int n) 
{ LinkNode *s,*r; 


L= (LinkNode * )malloc(sizeof(LinkNode)); // 创 建 头 结 点 
r=L; //r 始 终 指 向 尾 结 点 ,初始 时 指向 头 结 点 
for (int i 一 0;i<nii 十 十 ) // 循 环 建立 数据 结 点 
{ ss=(LinkNode * )malloc(sizeof(LinkNode) ) ; 
s 一 > data=a[]; // 创 建 数据 结 点 s 
IT 一 > next 一 s; // 将 结 点 s 插 和 人 到 结 点 r 之 后 
I=s; 
} 
r—>next=NULL; // 尾 结 点 的 next 域 置 为 NULL 
} 
DN "~ 
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人 插入 : >next=s; 


ET r=s; 


2.18 将 s 所 指 结 点 插入 到 表 尾 






































本 算法 的 时 间 复 杂 度 为 O(n) ,其 中 ?为 单 链表 中 数据 结 点 的 个 数 。 
车 数组 a 包含 4 个 元 素 1.2、3 和 4, 则 调用 CreateListR(L,a,4) 建 立 的 单 链表 如 图 2. 19 所 
示 , 所 以 在 采用 尾 插 法 建 表 时 单 链 表 中 数据 结 点 的 顺序 与 数组 a 中 元 素 的 顺序 相同 。 





@00,E 和 i 














EE 


图 2.19 一 个 单 链表 工 























注意 : 整体 创建 单 链表 的 两 个 算法 特别 是 尾 插 法 建 表 算法 是 很 多 其 他 
复杂 算法 的 基础 ,读者 必须 牢固 掌握 。 例 如 将 两 个 单 链 表 合 并 成 一 个 单 链 
表 等 都 是 利用 尾 插 法 建 表 算法 实现 的 。 


3 线性 表 可 本 运 算 寿 单 链 表 昌 的 实现 


采用 单 链表 实现 线性 表 基本 运算 的 算法 如 下 。 




















1) 初始 化 线性 表 InitList(&L) 让 
该 运算 建立 一 个 空 的 单 链表 ,如 图 2. 20 所 示 , 即 创 A 
建 一 个 头 结 点 并 将 其 next 域 设置 为 空 。 算 法 如 下 : 图 2.20 创建 一 个 空 的 单 链表 


void InitList(LinkNode * &L) 
{ L=(LinkNode * )malloc(sizeof(LinkNode)); 

L ->next=NULL; // 创 建 头 结 点 ,其 next 域 置 为 NULL 
} 


本 算法 的 时 间 复 杂 度 为 O(1) 。 

2) 销毁 线性 表 DestroyList(&L) 

该 运算 释放 单 链表 工 占用 的 内 存 空间 , 即 逐 一 释放 全 部 结 点 的 空间 。 其 过 程 是 让 pre、 
户 指 向 两 个 相 邻 的 结 点 (初始 时 pre 指向 头 结 点 ,p 指向 首 结 点 ), 如 图 2. 21 所 示 。 当 户 不 
为 空 时 循环 : 释放 结 点 pre, 然 后 pre\ 同步 后 移 一 个 结 点 。 循 环 结束 后 ,pre 指向 尾 结 点 ， 
再 将 其 释放 。 算 法 如 下 : 


void DestroyList(LinkNode * &L) 


{ LinkNode * pre=L, * p=L—> next; //pre 指向 结 点 p 的 前 驱 结 点 
while (p!= NULL) // 扫 描 单 链表 工 
{ free(pre); // 释 放 pre 结 点 
pre=p; //pre、p 同步 后 移 一 个 结 点 


p 王 Pre 一 > next; 
} 
free(pre); // 循 环 结束 时 p 为 NULL, pre 指向 尾 结 点 ,释放 它 
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图 2.21 pre、p 指 向 两 个 相 邻 的 结 点 


本 算法 的 时 间 复 杂 度 为 O(n) ,其 中 ”为 单 链表 中 数据 结 点 的 个 数 。 
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3) 判断 线性 表 是 否 为 空 表 ListEmpty(L) 
该 运算 在 单 链表 工 中 没有 数据 结 点 时 返回 真 ,否则 返回 假 。 算 法 如 下 : 


bool ListEmpty(LinkNode * 工 ) 
{ 

return(L -> next== NULL); 
} 


本 算法 的 时 间 复 杂 度 为 0(1)。 

4) 求 线 性 表 的 长 度 ListLength(L) 

该 运算 返回 单 链表 工 中 数据 结 点 的 个 数 。 由 于 单 链表 没有 存放 数据 结 点 个 数 的 信息 ， 
需要 通过 遍历 来 统计 。 其 过 程 是 让 p 指向 头 结 点 ,n 用 来 累计 数据 结 点 个 数 (初始 值 为 0)， 
当 p 不 为 空 时 循环 : n 增 1,p 指向 下 一 个 结 点 。 循 环 结束 后 返回 nw。 算法 如 下 : 


int ListLength(LinkNode *L) 
{ intn=0; 


LinkNode * p=L; //p 指向 头 结 点 ,n 置 为 0( 即 头 结 点 的 序号 为 0) 
while (p 一 next!= NULL) 
tt 
p=p—> next; 
} 
return(n); // 循 环 结束 ,p 指向 尾 结 点 ,其 序号 n 为 结 点 个 数 


} 


本 算法 的 时 间 复 杂 度 为 O(n) ,其 中 为 单 链表 中 数据 结 点 的 个 数 。 
5) 输出 线性 表 DispList(L) 


该 运算 逐一 扫描 单 链表 工 的 每 个 数据 结 点 ,并 显示 各 结 点 的 data 域 值 。 算 法 如 下 : 
void DispList(LinkNode * L) 
{ LinkNode * p=L -> next; //p 指向 首 结 点 
while (p!=NULL) //p 不 为 NULL, 输 出 p 结 点 的 data 域 
{ printf("%d",p—> data); 
p= p> next; //p 移 向 下 一 个 结 点 


} 
printf("\n"); 
} 





本 算法 的 时 间 复 杂 度 为 O(n) ,其 中 "为 单 链表 中 数据 结 点 的 个 数 。 

6) 求 线性 表 中 的 某 个 数据 元 素 值 GetElem(L .i.&e) 

该 运算 在 单 链表 工 中 从 头 开始 找到 第 i 个 结 点 , 若 存在 第 ;个 数据 结 点 , 则 将 其 data 域 
值 赋 给 变量 e。。 其 过 程 是 让 p 指向 头 结 点 ,j 用 来 累计 遍历 过 的 数据 结 点 个 数 (初始 值 为 
0), 当 j<i 且 z 不 为 空 时 循环 : j 增 1,p 指向 下 一 个 结 点 。 循 环 结束 后 有 两 种 情况 , 若 p 为 
空 ,表示 单 链 表 工 中 没有 第 i 个 数据 结 点 (参数 i 错误 ) ,返回 false; 否则 找到 第 i 个 数据 结 
点 ,提取 它 的 值 并 返回 true。 算 法 如 下 : 


人 2 人 SP EE 


bool GetElem(LinkNode * L,int i,ElemType &e) 


{ intj=0; 
LinkNode * p=L; //Pp 指向 头 结 点 ,j 置 为 0( 即 头 结 点 的 序号 为 0) 
if (i<=0) return false; Wi 错误 返回 假 
while (Gj<i && p! 二 NULL) ”// 找 第 i 个 结 点 p 
a 
p=p—> next; 
} 
if (p==NULL) // 不 存在 第 i 个 数据 结 点 ,返回 false 
return false; 
else // 存 在 第 i 个 数据 结 点 ,返回 true 


{ e=p—> data; 
return true; 
} 
} 


本 算法 的 时 间 复 杂 度 为 O(n) ,其 中 为 单 链表 中 数据 结 点 的 个 数 。 

7) 按 元 素 值 查找 LocateElem(L ,e) 

该 运算 在 单 链表 工 中 从 头 开始 找 第 一 个 值 域 与 e 相等 的 结 点 , 若 存在 这 样 的 结 点 , 则 返 
回 迎 辑 序 号 ,和 否则 返回 0。 算 法 如 下 : 


int LocateElem(LinkNode * 工 ,ElemType e) 


{ inti=]1; 

LinkNode * p=L 一 > next; //p 指向 首 结 点 ,i 置 为 1( 即 首 结 点 的 序号 为 1) 

while (p!=NULL &R& p—> data!=e) // 查 找 data 值 为 e 的 结 点 ,其 序号 为 i 

{ p=p—> next; 
Hm 

} 

if (p== NULL) // 不 存在 值 为 e 的 结 点 ,返回 0 
return(0); 

else // 存 在 值 为 e 的 结 点 ,返回 其 逻辑 序号 i 
return(iD ; 


} 


本 算法 的 时 间 复 杂 度 为 OC0z) ,其 中 ?为 单 链表 中 数据 结 点 的 个 数 。 

8) 插入 数据 元 素 ListInsert(&L .i,e) 

该 运算 的 实现 过 程 是 先 在 单 链表 工 中 找到 第 i 一 1 个 结 点 ,由 p 指向 它 。 若 存在 这 样 的 
结 点 ,将 值 为 e 的 结 点 (s 指向 它 ) 插 入 到 p 所 指 结 点 的 后 面 。 算 法 如 下 : 





bool ListInsert(LinkNode * &L,int i,ElemType e) ~ 
1 inti=08 
LinkNode * p=L, *s; //P 指向 头 结 点 ,j 置 为 0( 即 头 结 点 的 序号 为 0) 
if (i<=0) return false; /让 错误 返回 false 
while (j<i 一 1 && p! 二 NULL) ”// 查 找 第 i 一 1 个 结 点 p 
,0 
p=p~> next; 


} 
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if (p== NULL) // 未 找到 第 i 一 1 个 结 点 ,返回 false 

return false; 
else // 找 到 第 i 一 1 个 结 点 p, 插 和 人 新 结 点 并 返回 true 
{ s=(LinkNode * )malloc(sizeof(LinkNode) ) ; 

s 一 data=e; // 创 建新 结 点 s, 其 data 域 置 为 e 

s 一 next 一 p 一 > next; // 将 结 点 s 插 入 到 结 点 p 之 后 


p 一 > next=s; 
return true; 


} 


本 算法 的 时 间 复 杂 度 为 O(n) ,其 中 为 单 链表 中 数据 结 点 的 个 数 。 

9) 删除 数据 元 素 ListDelete(&L .i.&e) 

该 运算 的 实现 过 程 是 先 在 单 链表 工 中 找到 第 i 一 1 个 结 点 ,由 p 指向 它 。 若 存在 这 样 的 
结 点 , 且 也 存在 后 继 结 点 (由 g 指向 它 ), 则 删除 g 所 指 的 结 点 ,返回 true; 否则 返回 false, 表 
示 参 数 i 错误。 算法 如 下 : 


bool ListDelete(LinkNode * &L,int i, ElemType &e) 


{ intj=0; 
LinkNode * p=L, *q; //Pp 指向 头 结 点 ,j 置 为 0( 即 头 结 点 的 序号 为 0) 
if (i<=0) return false; /i 错误 返回 false 
while (j <i—1 && p!=NULL) // 查 找 第 一 1 个 结 点 
ts 
p=p-> next; 
} 
if (p== NULL) // 未 找到 第 i 一 1 个 结 点 ,返回 false 
return false; 
else // 找 到 第 一 1 个 结 点 p 
{ ，q=p 一 > next; //q 指 向 第 i 个 结 点 
if (q==NULL) // 若 不 存在 第 i 个 结 点 ,返回 false 
return false; 
e=q 一 data; 
p 一 next=q 一 > next; // 从 单 链表 中 删除 q 结 点 
free(q); // 释 放 q 结 点 
return true; // 返 回 true 表示 成 功 删除 第 i 个 结 点 


} 


本 算法 的 时 间 复 杂 度 为 O(n) ,其 中 为 单 链表 中 数据 结 点 的 个 数 。 

【 例 2.6】 有 一 个 带头 结 点 的 单 链表 工 一 (ai ,bi ,az ,bs，…,a,,b,) ,设计 一 个 算法 将 其 
拆 分 成 两 个 带头 结 点 的 单 链表 Ll 和 工 2, 其 中 直 1 王 (al az， ,av),L2 一 ( 略 ,D D1)， 
要 求 工 1 使 用 工 的 头 结 点 。 

利用 原单 链表 工 中 的 所 有 结 点 通过 改变 指针 域 重 组 成 两 个 单 链表 
Ll1 和 LL2。 由 于 Ll 中 结 点 的 相对 顺序 与 工 中 的 相同 ,所 以 采用 尾 插 法 建立 
单 链 表 工 1; 由 于 工 2 中 结 点 的 相对 顺序 与 工 中 的 相反 ,所 以 采用 头 插 法 建 
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立 单 链表 L2。 算 法 如 下 : 视频 讲解 
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void split(LinkNode * &L,LinkNode * 中 L1,LinkNode * &L2) 


{ LinkNode * p=L —>next, *q, *r]; //Pp 指 向 第 1 个 数据 结 点 
L1=L; //L1 利用 原来 L 的 头 结 点 
rl=L1l; /Vrl 始终 指向 L1 的 尾 结 点 
L2 一 (LinkNode * )malloc(sizeof(LinkNode)); // 创 建 L2 的 头 结 点 
L2 -> next=NULL; // 置 L2 的 指针 域 为 NULL 
while (p!=NULL) 

{ rl—>next=p; // 采 用 尾 插 法 将 p(data 值 为 ai) 插 入 L1 中 
rl=p; 
p=p—> next; //P 移 到 下 一 个 结 点 (data 值 为 bi) 
q=p—> next; // 头 插 法 会 修改 结 点 Pp 的 next 域 ,用 q 保存 结 点 p 的 后 继 结 点 
p 一 > next 一 L2 -> next; ”// 采 用 头 插 法 将 结 点 p 插 入 L2 中 
L2 一 next=p; 
p=q; //Pp 重新 指向 ai+1 的 结 点 
} 
rl —>next=NULL; // 尾 结 点 next 置 空 


} 


【 例 2.7】 设计 一 个 算法 ,删除 一 个 单 链表 工 中 元 素 值 最 大 的 结 点 (假设 这 样 的 结 点 
唯一 ) 。 

扫 -- 扫 在 单 链表 中 删除 一 个 结 点 先 要 找到 它 的 前 驱 结 点 ,用 指针 p 扫描 
整个 单 链 表 ,pre 指向 结 点 p 的 前 驱 结 点 ,在 扫描 时 用 maxp 指向 data 域 值 
最 大 的 结 点 ,maxpre 指向 maxp 所 指 结 点 的 前 驱 结 点 。 当 单 链表 扫描 完毕 
后 ,通过 maxpre 所 指 结 点 删除 其 后 的 结 点 , 即 删除 了 结 点 值 最 大 的 结 点 。 
视频 讲解 算法 如 下 : 




















void delmaxnode(LinkNode * &L) 
{ LinkNode * p 一 L 一 > next, * pre=L, * maxp=p, * maxpre= pre; 


while (p!=NULL) // 用 p 扫描 整个 单 链表 , pre 始终 指向 其 前 驱 结 点 
{ if(maxp—>data<p—> data) // 若 找到 一 个 更 大 的 结 点 

{ maxp=p; // 更 新 maxp 

maxpre= pre; // 更 新 maxpre 

} 

pre=p; //p、pre 同步 后 移 一 个 结 点 

p 王 p 一 > next; 
} 
maxpre 一 > next 一 maxp 一 > next; // 删 除 maxp 结 点 
freeCmaxp); // 释 放 maxp 结 点 


} 


【 例 2.8】 有 一 个 带头 结 点 的 单 链表 L( 至 少 有 一 个 数据 结 点 ) ,设计 一 个 算法 使 其 元 
素 递增 有 序 排列 。 

由 于 单 链 表 工 中 有 一 个 以 上 的 数据 结 点 ,首先 构造 一 个 只 含 头 结 点 和 首 结 点 的 有 
序 单 链表 (只 含 一 个 数据 结 点 的 单 链表 一 定 是 有 序 的 )。 然 后 扫描 单 链表 工 余下 的 结 点 (由 
p 指向 ) ,在 有 序 单 链表 中 通过 比较 找 插入 结 点 p 的 前 驱 结 点 (由 pre 指向 它 ) ,在 pre 结 点 
之 后 插入 p 结 点 ,如 图 2. 22 所 示 . 直 到 p 二 二 NULL 为 止 ( 这 里 实际 上 采用 的 是 直接 插入 排 
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序 方法 ) 。 算 法 如 下 : 
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图 2.22 将 结 点 p 有 序 插入 到 有 序 单 链表 中 


void sort(LinkNode * &L) 
{ LinkNode *p, * pre, *q; 
p=L 一 next 一 > next; //p 指 向 工 的 第 2 个 数据 结 点 
工人 一 next 一 next=NULL;  ”// 构 造 只 含 一 个 数据 结 点 的 有 序 单 链表 
while (p!=NULL) 
{ q=p—> next; //q 保 存 p 结 点 后 继 结 点 的 指针 
pre=L; // 从 有 序 单 链表 开头 进行 比较 ,pre 指向 插入 结 点 的 前 驱 结 点 
while (pre —> next!= NULL &&. pre—> next 一 data<p 一 > data) 
pre 一 pre 一 next;  // 在 有 序 单 链表 中 找 插入 p 所 指 结 点 的 前 驱 结 点 (pre 所 指向 ) 
pp 一 next 二 pre 一 > next; ”// 在 pre 所 指 结 点 之 后 插入 p 所 指 结 点 


pre 一 > next=p; 

















p=q; // 扫 描 原 单 链表 余下 的 结 点 
} 
} 
233 双 链 表 
对 于 双 链 表 , 采 用 类 似 于 单 链 表 的 类 型 声明 ,其 结 点 类 型 DLinkNode 
的 声明 如 下 ， 
视频 讲解 
typedef struct DNode 
{ ElemType data; // 存 放 元 素 值 
struct DNode * prior; // 指 向 前 驱 结 点 
struct DNode * next; // 指 向 后 继 结 点 
} DLinkNode; // 双 链表 的 结 点 类 型 


在 双 链 表 中 ,由 于 每 个 结 点 既 包 含 一 个 指向 后 继 结 点 的 指针 ,又 包含 一 个 指向 前 驱 结 点 的 
指针 ,所 以 当 访 问 过 一 个 结 点 后 既 可 以 依次 向 后 访问 每 一 个 结 点 ,也 可 以 依次 向 前 访问 每 一 
个 结 点 。 因 此 与 单 链表 相 比 , 双 链 表 中 访问 一 个 结 点 的 前 、 后 结 点 更 方便 。 提 科 

整体 建立 双 链 表 也 有 两 种 方法 , 即 头 插 法 和 尾 插 法 。 采 用 头 插 法 建立 
双 链 表 的 过 程 和 单 链表 头 插 法 相似 ,算法 如 下 : 

















视频 讲解 


void CreateListF(DLinkNode * &&L,ElemType a[] ,int n) // 采 用 头 插 法 建立 双 链 表 
// 由 含有 n 个 元 素 的 数组 a 创建 带头 结 点 的 双 链表 工 
{ DLinkNode * s; 

L= (DLinkNode * )malloc(sizeof(DLinkNode) ) ; // 创 建 头 结 点 
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L -> prior 王 L 一 next=NULL; // 前 后 指针 域 置 为 NULL 
for (int i 一 0;i< nji 十 十 ) // 循 环 建立 数据 结 点 
{ s=(DLinkNode * )malloc(sizeof(DLinkNode)); 
s—> data=a[] ; // 创 建 数据 结 点 s 
s—> next=L 一 > next; // 将 s 结 点 插入 到 头 结 点 之 后 
if (L —> next!=NULL) // 若 工 存在 数据 结 点 ,修改 L -> next 的 前 驱 指 针 


工 一 next 一 > prior 一 Si; 
工 一 next 一 5; 


s—> prior=L; 

} 

采用 尾 插 法 建立 双 链 表 的 过 程 和 单 链表 尾 插 法 相似 ,算法 如 下 : 

void CreateListR(DLinkNode * &L,ElemType a[] ,int n) // 采 用 尾 插 法 建立 双 链表 


// 由 含有 n 个 元 素 的 数组 a 创建 带头 结 点 的 双 链 表 L 
{ DLinkNode *s, *r; 


L= (DLinkNode * )malloc(sizeof( DLinkNode)); // 创 建 头 结 点 
r=L; //r 始 终 指向 尾 结 点 ,开始 时 指向 头 结 点 
for (int i 一 0;i< nii 十 十 ) // 循 环 建立 数据 结 点 
{ s=(DLinkNode * )malloc(sizeof(DLinkNode) ) ; 
s—> data=a[] ; // 创 建 数据 结 点 s 
T 一 > next 一 s;s 一 > prior 一 T; // 将 s 结 点 插入 到 上 结 点 之 后 
r=s; //r 指 向 尾 结 点 
} 
r—>next=NULL; // 尾 结 点 的 next 域 置 为 NULL 


2 扫 一 扫 

在 双 链 表 中 ,有 些 运 算 ( 如 求 长 度 、 取 元 素 值 和 查找 元 素 等 ) 的 算法 与 单 
链表 中 的 相应 算法 是 相同 的 ,这 里 不 多 讨论 。 但 双 链 表 中 插入 和 删除 结 点 
是 不 同 于 单 链表 的 ,下 面 分 别 介绍 双 链 表 的 插入 和 删除 操作 算法 。 er 

假设 在 双 链 表 中 尹 所 指 结 点 之 后 插入 一 个 结 点 ,其 指针 的 变化 过 程 如 请 
图 2. 23 所 示 。 其 操作 语句 描述 如 下 ( 共 修改 4 个 指针 域 ) : 











s—> next=p—> next; // 将 s 结 点 插入 到 p 结 点 之 后 





p 一 > next—> prior=s; aa 


s 一 > prior=p; 
了 一 next 一 sj 


注意 : 在 上 述 描述 语句 中 ,修改 p 一 > next 地 址 尽量 放 在 后 面 执行 ,否则 会 因为 找 不 到 
结 点 力 的 后 继 结 点 而 导致 插入 错误 。 

在 双 链 表 工 中 的 第 ; 个 位 置 上 插入 值 为 e 的 结 点 时 采用 类 似 单 链表 的 插入 过 程 , 先 查 
找 第 i 二 1 个 结 点 (由 p 指向 它 ) ,然后 在 p 所 指 结 点 之 后 插入 一 个 新 结 点 。 算 法 如 下 : 
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(a) 插入 前 (b) s—>next=p-—>next; 
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(c) p->next->prior=s; (d) s—>prior=p; 
Pp 
| | = 
p s 
| \ 
5 | 于 面 十 忆 局 
(e) p->next=s; (f) 插 入 后 
图 2.23 在 双 链 表 插 入 结 点 的 过 程 
bool ListInsert(DLinkNode * &L,int i,ElemType e) 
{ intj=0; 
DLinkNode * p=L, *s; //p 指向 头 结 点 ,j 设置 为 0 
if (i<=0) return false; //i 错误 返 回 false 
while (<i—1 && p!=NULL) // 查 找 第 i 一 1 个 结 点 
Sl pi 
p=p-> next; 
} 
if (p== NULL) // 未 找到 第 i 一 1 个 结 点 ,返回 false 
return false; 
else // 找 到 第 i 一 1 个 结 点 p 
{ s=(DLinkNode * )malloc(sizeof(DLinkNode)); 
s—> data=e; // 创 建新 结 点 s 
s—> next=p—> next; // 在 p 结 点 之 后 插入 s 结 点 
if (p—> next!= NULL) // 若 p 结 点 存在 后 继 结 点 ,修改 其 前 驱 指 针 


p 一 next 一 > prior 一 si; 
s—> prior=p; 
p 一 > next=s; 
return true; 


本 算法 的 时 间 复杂 度 为 O(n) ,其 中 为 双 链 表 中 数据 结 点 的 个 数 。 
假设 删除 双 链 表 工 中 结 点 p 的 后 继 结 点 ,指针 的 变化 过 程 如 图 2. 24 所 示 。 其 操作 语 


个 DOx 


句 描述 如 下 ( 共 修 改 两 个 指针 域 ) : 


Pp—> next 一 q 一 > nexti; 
q—> next 一 > prior=p; 
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(b) p->next=p->next->next; 或 p->next=q->next; 


“4 | [ 王 | | 
ASS 


(c) q->next—>prior=p ; 


(d) 删除 后 
图 2. 24 在 双 链 表 删 除 结 点 的 过 程 









































在 双 链表 工 中 删除 第 i 个 结 点 时 采用 类 似 单 链 表 的 删除 过 程 , 先 查找 第 ;一 1 个 结 点 p， 
然后 删除 结 点 p 的 后 继 结 点 。 算 法 如 下 : 


bool ListDelete( DLinkNode * &L,int i,ElemType &e) 





{ intj=0; 
DLinkNode * p=L, * q; //P 指向 头 结 点 ,j 设置 为 0 
if (i<=0) return false; /Wi 错误 返回 false 
while (j<i 一 1 && p! 二 NULL) // 查 找 第 i 一 1 个 结 点 
Ut 
P=Pp-> next; 
} 
if (p== NULL) // 未 找到 第 i 一 1 个 结 点 
return false; 
else // 找 到 第 i 一 1 个 结 点 (由 Pp 指向 它 ) 
{  q=p—> next; //q 指 向 第 i 个 结 点 
if (q==NULL) // 当 不 存在 第 i 个 结 点 时 返回 false 
return false; 
e=q 一 data; 
p—> next 一 q 一 > next; // 从 双 链 表 中 删除 结 点 q 


if (p—> next!=NULL) // 若 p 结 点 存在 后 继 结 点 ,修改 其 前 驱 指 针 
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p 一 next 一 prior=p; 
free(q) ; // 释 放 q 结 点 


return true; 


} 


本 算法 的 时 间 复 杂 度 为 0(x) ,其 中 为 双 链 表 中 数据 结 点 的 个 数 。 

由 于 在 双 链 表 中 通过 一 个 结 点 既 可 以 找到 它 的 前 驱 结 点 ,又 可 以 找到 它 的 后 继 结 点 ,所 
以 在 双 链表 工 中 实现 插入 和 删除 第 ; 个 结 点 时 可 以 先 查 找 第 i 个 结 点 (由 p 指向 它 ), 择 入 
时 在 p 所 指 结 点 的 前 面 持 入 一 个 新 结 点 ,删除 时 通过 p 所 指 结 点 的 前 驱 结 点 来 删除 它 。 


Em 
【 例 2.9】 有 一 个 带头 结 点 的 双 链 表 工 ,设计 一 个 算法 将 其 所 有 元 素 逆 
置 , 即 第 1 个 元 素 变 为 最 后 一 个 元 素 ,第 2 个 元 素 变 为 倒数 第 2 个 元 素 …… 
最 后 一 个 元 素 变 为 第 1 个 元 素 。 : 
先 构造 只 有 一 个 头 结 点 的 空 双 链 表 工 (利用 原来 的 头 结 点 ), 用 pp 扫 于 六 
描 双 链表 的 所 有 数据 结 点 ,采用 头 插 法 将 p 所 指 结 点 插入 到 工 中 ,如 图 2. 25 所 示 。 算 法 如 下 : 

















void reverse( DLinkNode * &L) // 双 链表 结 点 逆 置 算法 
{ DLinkNode * p 王 L 一 next,*qi  //p 指 向 首 结 点 
L—>next= NULL; // 构 造 只 有 头 结 点 的 双 链 表 L 
while (p!=NULL) // 扫 描 工 的 所 有 数据 结 点 
{  q=p—> next; // 会 修改 p 结 点 的 next 域 ,用 q 临 时 保存 其 后 继 结 点 
p 一 > next=L —> next; // 采 用 头 插 法 将 p 结 点 插入 到 双 链 表 中 
if (L -> next! 王 NULL) // 车 LL 中 存在 数据 结 点 
L—> next 一 > prior=p; // 修 改 原 来 首 结 点 的 前 驱 指 针 
工 一 > next 一 p; // 将 新 结 点 作为 首 结 点 
p 一 > prior=L; 
p=q; // 让 Pp 重新 指向 其 后 继 结 点 
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2.25 采用 头 插 法 将 p 所 指 结 点 插入 到 工 中 
































【 例 2.10】 有 一 个 带头 结 点 的 双 链 表 工 ( 至 少 有 一 个 数据 结 点 ) ,设计 一 个 算法 使 其 元 
素 递 增 有 序 排列 。 

本 算法 与 例 2. 8 算法 的 思路 相同 ,只 是 插入 结 点 的 操作 略 有 不 同 。 算 法 如 下 : 

void sort(DLinkNode * &L) // 双 链表 结 点 递增 排序 


{ DLinkNode * p, * pre, x qi 
p=L 一 next —> next; //Pp 指向 L 的 第 2 个 数据 结 点 
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L ->next-—>next=NULL; // 构 造 只 含 一 个 数据 结 点 的 有 序 表 
while (p!= NULL) 
{ gq=p—> next; //q 保 存 p 结 点 的 后 继 结 点 
pre=L; // 从 有 序 表 开头 进行 比较 ,pre 指向 插入 结 点 p 的 前 驱 结 点 
while (pre —> next!= NULL && pre—> next 一 data<p 一 > data) 
pre 一 pre 一 > next; // 在 有 序 表 中 找 插入 结 点 的 前 驱 结 点 pre 
p 一 > next 一 pre 一 > next; // 在 pre 结 点 之 后 插入 结 点 p 


if (pre 一 > next!= NULL) 
pre 一 > next 一 > prior 一 pi; 

pre 一 > next=p; 

p 一 prior= pre; 


p=q; // 扫 描 原 双 链表 余下 的 结 点 


234 循环 链表 


循环 链表 (circular linked list) 是 另 一 种 形式 的 链 式 存储 结构 。 循 环 链表 有 循环 单 链表 
和 循环 双 链 表 两 种 类 型 ,循环 单 链表 的 结 点 类 型 和 非 循环 单 链表 的 结 点 类 型 LinkNode 相 
同 ,循环 双 链 表 的 结 点 类 型 和 非 循环 双 链表 的 结 点 类 型 DLinkNode 相同 。 

把 单 链表 改 为 循环 单 链表 的 过 程 是 将 它 的 尾 结 点 next 指针 域 由 原来 为 空 改 为 指向 头 
结 点 ,整个 单 链表 形成 一 个 环 。 由 此 ,从 表 中 任 一 结 点 出 发 均 可 找到 链表 中 的 其 他 结 点 。 
图 2. 26(a) 所 示 为 带头 结 点 的 循环 单 链表 。 
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2.26 循环 链表 


把 双 链 表 改 为 循环 双 链 表 的 过 程 是 将 它 的 尾 结 点 next 指针 域 由 原来 为 空 改 为 指向 头 
结 点 ,将 它 的 头 结 点 prior 指针 域 改 为 指向 尾 结 点 ,整个 双 链 表 形 成 两 个 环 。 图 2. 26(b) 所 
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示 为 带头 结 点 的 循环 双 链 表 。 

循环 链表 的 基本 运算 实现 算法 与 对 应 非 循环 链表 的 算法 基本 相同 ,主要 差别 是 对 于 循 
环 单 链表 或 循环 双 链 表 工 ,判断 表 尾 结 点 p 的 条 件 是 p 一 >next 二 二 L; 另外 在 循环 双 链 表 工 
中 可 以 通过 上 一 > prior 快速 找到 尾 结 点 。 

【 例 2.11】 有 一 个 带头 结 点 的 循环 单 链 表 工 ,设计 一 个 算法 统计 其 data 域 值 为 zx 的 结 
点 个 数 。 

扫描 整个 循环 单 链表 ,用 i 累计 data 域 值 为 z 的 结 点 个 数 。 算 法 如 下 : 


int count(LinkNode * L,ElemType x) 


{ inti=0; 
LinkNode * p=L -> next; //P 指向 首 结 点 ,i 置 为 0 
while (p!=L) // 扫 描 循 环 单 链表 世 
{ if(p—>data==x) 
本 // 找 到 值 为 x 的 结 点 后 i 增 1 
p=p—> next; //Pp 指向 下 一 个 结 点 
} 
return i; // 返 回 值 为 x 的 结 点 个 数 


} 


【 例 2.12】 有 一 个 带头 结 点 的 循环 双 链 表 工 ,设计 一 个 算法 删除 第 
个 data 域 值 为 zx 的 结 点 。 

用 p 指针 扫描 整个 循环 双 链 表 来 查找 data 值 为 x 的 结 点 ,找到 后 
删除 p 结 点 ,并 返回 true, 若 未 找到 这 样 的 结 点 返回 false。 算 法 如 下 : 

















bool delelem( DLinkNode * &L,ElemType x) 
{ DLinkNode * p=L 一 > next; //Pp 指向 首 结 点 


while (p!=L &&. p—> data!=x) // 查 找 第 一 个 data 值 为 x 的 结 点 p 
p=p—> next; 
CDI= LY // 找 到 了 第 一 个 值 为 x 的 结 点 p 
{ p—> next—> prior=p—> prior; // 删 除 p 结 点 
p 一 prior 一 > next 一 p 一 next; 
free(p); 
return true; // 返 回 真 
} 
else // 没 有 找到 值 为 x 的 结 点 ,返回 false 


return false; 


} 


【 例 2.13】 设计 一 个 算法 ,判断 带头 结 点 的 循环 双 链 表 工 ( 含 两 个 以 上 的 结 点 ) 中 的 数 
据 结 点 是 否 对 称 。 

算法 思路 是 用 户 从 左 向 右 扫描 工 ,9 从 右 向 左 扫 描 工 ,然后 循环 。 若 pg 所 指 结 点 
的 data 域 不 相等 , 则 退出 循环 ,返回 false; 否则 继续 比较 ,直到 p= 二 g( 数 据 结 点 个 数 为 奇数 
的 情况 ) 或 者 p= 二 二 gq 一 > prior( 数 据 结 点 个 数 为 偶数 的 情况 ) 为 止 ,这 时 返回 true。 算 法 如 下 : 


bool Symm(DLinkNode * L) 
{ bool same 一 true; //same 表示 L 是 否 对 称 ,初始 时 为 true 
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DLinkNode * p=L -> next; //P 指向 首 结 点 
DLinkNode * q=L —> prior; //q 指向 尾 结 点 
while (same) 
{ if(p->data!l=q—> data) // 对 应 结 点 值 不 相同 ,退出 循环 
same=false; 
else 
{ if (p==q | p==q->prior) break; 
q 一 q 一 > prior; //q 前 移 一 个 结 点 
p=p 一 next; //p 后 移 一 个 结 点 


} 
» 
return same; 


} 


该 算法 利用 循环 双 链 表 工 的 特点 ,通过 工 一 > prior 直接 找到 尾 结 点 ,然后 进行 结 点 值 
的 比较 ,从 而 判断 工 的 数据 结 点 是 否 对 称 。 如 果 是 非 循环 双 链 表 , 需 要 通过 遍历 查找 尾 结 
点 ,显然 不 如 循环 双 链 表 的 性 能 好 。 


线性 表 的 应 用 米 


本 节 通 过 计算 任意 两 个 表 的 简单 自然 连接 过 程 讨 论 线性 表 的 应 用 。 假 设 有 两 个 表 4 

和 如 ,分 别 是 ma 行列 和 zw 行列 ,它们 的 简单 自然 连接 结果 C 一 4 P44B, 其 中 i 表示 

表 4 中 的 列 号 ,ji 表示 表 B 中 的 列 号 ,C 为 4 和 B 的 笛 卡 儿 积 中 满足 指定 连接 条 件 的 所 有 记 
录 组 ,该 连接 条 件 为 表 4 的 第 i 列 与 表 B 的 第 j 列 相等 。 例 如 : 

1 2 3 3 5 

4 一 233 B= 1 6 

上 和 3 4 





c=A ba B 的 计算 结果 如 下 : 
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由 于 每 个 表 的 行 数 不 确 定 , 因 此 采用 单 链表 作为 表 的 存储 结构 ,每 行 作为 一 个 数据 结 
点 ,也 称 为 行 结 点 。 另 外 ,每 行 中 的 元 素 个 数 也 是 不 确定 的 ,但 由 于 需要 提供 随机 查找 行 中 
的 数据 元 素 , 所 以 每 行 的 数据 元 素 采 用 顺序 存储 结构 ,这 里 用 长 度 为 MaxCol 的 数组 data 
存储 每 行 的 数据 。 因 此 该 单 链表 中 数据 结 点 的 类 型 声明 如 下 : 
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# define MaxCol 10 // 最 大 列 数 

typedef struct Nodel // 定 义 数据 结 点 类 型 

{ ElemType data[MaxCol]; // 存 放 一 行 的 数据 
Struct Nodel * next; // 指 向 后 继 数据 结 点 

} DList; // 行 结 点 类 型 


另外 ,需要 指定 每 个 表 的 行 数 和 列 数 , 为 此 将 单 链表 的 头 结 点 类 型 声明 如 下 : 


typedef struct Node2 


{ int Row,Col; // 行 数 和 列 数 
DList * next; // 指 向 第 一 个 数据 结 点 
} HList; // 头 结 点 类 型 


这 样 A、B 两 个 表 对 应 的 单 链表 存储 结构 如 图 2. 27 所 示 。 
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图 2.27 A.B 两 个 表 对 应 的 单 链表 存储 结构 





注意 : 在 前 面 讨 论 的 链表 中 , 头 结 点 的 类 型 与 数据 结 点 的 类 型 均 相同 ,而 这 里 两 者 的 类 
型 是 不 同 的 。 

通过 对 本 求解 问题 分 析 , 需 要 设计 以 下 4 个 基本 运算 算法 。 

。 CreateTable(&h): 采用 交互 方式 建立 单 链 表 几 。 

。 DestroyTable( &h): 销毁 单 链 表 儿 。 

。 DispTable(h): 输出 单 链表 六。 

。 LinkTable(h1,h2,&h): 由 hl 和 h2 连接 产生 结果 单 链表 彤 。 

1) 采用 交互 方式 建立 单 链表 的 算法 

采用 尾 插 法 建 表 的 方法 创建 存储 一 个 表 的 单 链表 ,用 户 先 输入 表 的 行 数 和 列 数 , 然 后 输 
和 各行 的 数据 。 在 采用 尾 插 法 建 表 时 需要 设置 一 个 尾 结 点 指针 ”~, 一 般 尾 插 法 是 先 让 -~ 指 
向 头 结 点 ,但 这 里 头 结 点 和 数据 结 点 的 类 型 不 同 , 且 头 结 点 只 要 一 个 ,而 数据 结 点 有 若干 个 ， 
所 以 只 让 7 指向 数据 结 点 。 对 应 的 建 表 算 法 如 下 : 


void CreateTable( HList * &h) 

{ intij; 
DList *r,*s; 
h= (HList * )malloc(sizeof(HList)); // 创 建 头 结 点 
printf(" 表 的 行 数 , 列 数 :"); 
scanf("%d%d", &h -> Row, &h -> Col); // 输 入 表 的 行 数 和 列 数 
for (i=0;i<h—> Row;i 十 十 ) // 输 入 所 有 行 的 数据 
{ printf(" 第 %%d 行 :",i 十 1); 
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s= (DList * )malloc(sizeof( DList)) ; // 创 建 数据 结 点 s 


for (j=0;j<h -> Col;j 十 十 ) // 输 入 一 行 的 数据 
scanf("%d", &s —> data0]); 
让 (h—> next==NULL) // 插 入 第 一 个 数据 结 点 的 情况 
h -> next 一 s; 
else // 插 入 其 他 数据 结 点 的 情况 
IT 一 next 一 s; // 将 s 结 点 插入 到 上 结 点 之 后 
ee //r 始 终 指向 尾 结 点 
} 
r—> next=NULL; // 尾 结 点 的 next 域 置 空 


} 


显然 该 算法 的 时 间 复 杂 度 为 OC(m Xn) ,其 中 m 为 表 的 行 数 n 为 表 的 列 数 。 

2) 销毁 单 链表 的 算法 

该 算法 和 前 面 销 毁 单 链表 的 算法 类 似 , 只 是 要 针对 头 结 点 和 数据 结 点 类 型 不 相同 的 情 
况 进 行 相应 修改 。 对 应 的 算法 如 下 : 


void DestroyTable(HList * &h) 
{ DList * pre 一 h 一 next, * p 一 pre 一 > next; 
while (p!=NULL) 
{ free(pre); 
pre=p; p=p—> next; 
} 
free(pre) ; 
free(h) ; 
} 


该 算法 的 时 间 复 杂 度 为 OC(m) ,其 中 m 为 表 的 行 数 。 
3) 输出 单 链 表 的 算法 


对 应 的 输出 表 的 算法 如 下 : 

void DispTable( HList * h) 

{ intj; 
DList * p 一 h 一 > next; //p 指向 开始 行 结 点 
while (p!= NULL) // 扫 描 所 有 行 
{ for (=0;j<h->Col;j++) // 输 出 一 行 的 数据 


printf("%4d",p—> data[ 门 ); 
printf("\n"); 
p=p—> next; //p 指向 下 一 个 行 结 点 
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该 算法 的 时 间 复 杂 度 为 OC(m Xn) ,其 中 m 为 表 的 行 数 n 为 表 的 列 数 。 

4) 表 连 接 运 算 算法 

为 了 实现 两 个 表 h1 和 h2 的 简单 自然 连接 , 先 要 输入 两 个 表 连 接 的 列 序号 i 和 j ,然后 
用 p 指针 扫描 单 链表 h1, 对 于 Al 的 每 个 数据 结 点 ,都 用 9 指针 从 头 至 尾 扫 描 单 链表 h2 的 
所 有 数据 结 点 ,车 自然 连接 条 件 成 立 , 即 Al 的 p 所 指 结 点 和 h2 的 g 所 指 结 点 满足 连接 条 件 
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p 一 > data[i 一 1] 二 二 gq 一 > data[j 一 1], 则 在 结果 单 链表 有 中 添加 一 个 新 结 点 。 结 果 单 链表 
hh 也 是 采用 尾 插 法 建 表 方 法 创建 的 。 实 现 两 个 表 hl1 和 h2 的 简单 自然 连接 并 生成 结果 单 链 
表 所 的 算法 如 下 : 











void LinkTable(HList * hl,HList * h2,HList * &h) 

{ inti,j,k; 
DList * p 一 hl 一 > next, * q, * s, * I; 
printf( "连接 字段 是 :第 1 个 表 序 号 ,第 2 个 表 序 号 :"); 
scanf("%d%d", &i, &j); 


h= (HList * )malloc(sizeof( HList)); // 创 建 结果 表 头 结 点 
h—> Row=0; // 置 行 数 为 0 
h—> Col=hl 一 Col+h?2 -> Col; // 置 列 数 为 表 1 和 表 2 的 列 数 和 
h 一 next 王 NULL; // 置 next 域 为 NULL 
while (p!=NULL) // 扫 描 表 1 
{ gq=h2—>next; //q 指向 表 2 的 首 结 点 
while (q!= NULL) // 扫 描 表 2 


{ if(p->data[i—1]==q-> data0—1]) // 对 应 字段 值 相 等 
{ ”ss 二 (DList x )malloc(sizeof(DList)); ”// 创 建 一 个 数据 结 点 s 


for (k=0;k<hl 一 Col;k 十 十 ) // 复 制 表 1 的 当前 行 
s—> data[k]=p—> data[k]; 
for (k=0;k<h2 -> Col;k++ 十 ) // 复 制 表 2 的 当前 行 
s—> data[hl 一 > Col+k] =q—> data[k] ; 
if (h -> next== NULL) // 若 插入 的 是 第 一 个 数据 结 点 
h 一 > next=s; // 将 s 结 点 插入 到 头 结 点 之 后 
else // 若 插入 其 他 数据 结 点 
TI 一 > next 一 si // 将 s 结 点 插入 到 结 点 r 之 后 
r=s; //r 始终 指向 尾 结 点 
h 一 Row 十 十 ; // 表 行 数 增 1 
} 
q 一 q 一 > next; // 表 2 后 移 一 个 结 点 
} 
p 一 p 一 > next; // 表 1 后 移 一 个 结 点 
} 
r—>next=NULL; // 表 尾 结 点 的 next 域 置 空 


} 


于 求解 程序 


在 设计 好 4 个 基本 运算 算法 以 后 ,设计 以 下 主 函数 调用 这 些 算法 完成 求解 任务 : 


int main() 
{ HList *hl,*h2,*h; 
printf(" 表 1:\n"); 





CreateTableChl1); // 创 建 表 1 
printf(" 表 2:\n"); 

CreateTable(h2); // 创 建 表 2 
LinkTableChl ,h2,h); // 连 接 两 个 表 
printf(" 连 接 结果 表 :\n"); 

DispTable(h) ; // 输 出 连接 结果 


Ce] 
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DestroyTable(hl ) ; // 销 毁 单 链表 hl 
DestroyTable( h2) ; // 销 毁 单 链表 h2 
DestroyTable(h) ; // 销 毁 单 链 表 h 


return 1; 


运行 本 程序 ,输入 相应 表 数 据 , 得 到 对 应 的 简单 自然 连接 结果 ( 带 下 画 线 的 表示 用 户 输 


入 的 数据 ,x 表示 按 回 车 键 ,下 同 ): 








第 3 行 :3 4 
连接 字段 是 :第 1 个 表 序 号 ,第 2 个 表 序号 :3 1 x 
连接 结果 表 : 
el 
12334 
Zols 
23334 
ia 


所 谓 有 序 表 (ordered list) 是 指 这 样 的 线性 表 , 其 中 所 有 元 素 以 递增 或 递减 方式 有 序 排 


列 。 为 了 简单 ,假设 有 序 表 元 素 以 递增 方式 排列 。 从 中 可 以 看 到 ,有 序 表 和 扫 -- 扫 





线性 表 中 元 素 之 间 的 逻辑 关系 相同 ,其 区 别 是 运算 实现 不 同 。 
251 有 序 表 的 抽象 数据 类 型 描述 

















有 序 表 的 抽象 数据 类 型 描述 如 下 : 人 


ADT OrderList 
{ ”数据 对 象 : 
D={ ai| 1<i<n,n 之 0,a; 为 ElemType 类 型 } //ElemType 是 自 定义 类 型 标识 符 
数据 关系 : 
R= {<ai,ain>| ai,aim ED BL aiain,i=1, ,nn—1} 
基本 运算 : 
InitList(&&L): 初始 化 有 序 表 工 。 
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DestroyList(&&L): 销毁 有 序 表 工 。 

ListEmpty(L): 判断 有 序 表 工 是 否 为 空 表 。 

ListLength(L): 求 有 序 表 工 的 元 素 个 数 。 

DispList(L) : 输出 有 序 表 工 。 

GetElem(L,i, &e) : 求 有 序 表 工 的 第 i 个 元 素 。 

LocateElem(L,e) : 返回 有 序 表 工 中 第 一 个 元 素 值 等 于 e 的 元 素 的 序号 。 
ListInsert(&L,e) : 在 有 序 表 工 中 插入 一 个 元 素 值 为 e 的 元 素 。 
ListDelete(&& Li &e) : 删除 有 序 表 工 中 的 第 i 个 元 素 。 





252 有 序 表 的 存储 结构 及 其 基本 运算 算法 


由 于 有 序 表 中 元 素 之 间 的 逻辑 关系 与 线性 表 的 完全 相同 ,因此 可 以 采 
用 顺序 表 ( 类 型 为 SqList) 和 链表 ( 单 链表 结 点 类 型 为 LinkNode, 双 链表 结 
点 类 型 为 DLinkNode) 进 行 存储 。 

若 以 顺序 表 存 储 有 序 表 ,大 家 会 发 现 基本 运算 算法 中 只 有 ListInsert() 算 法 与 前 面 的 顺 
序 表 对 应 的 运算 有 所 差异 ,其 余 都 是 相同 的 。 有 序 顺序 表 的 ListInsert() 算 法 如 下 : 














void ListInsert(SqList * &L,ElemType e) 


{ inti=0,j; 
while (i<L 一 > length && L —> data[i]<e) 
[am // 查 找 值 为 e 的 元 素 


for (j 王 ListLength(L);j> ij 一 一 ) // 将 data[ 丫 及 后 面 的 元 素 后 移 一 个 位 置 
L-—>data[] =L 一 data0—1]; 
L ->data[li] =e; 
工 一 length 十 十 ; // 有 序 顺 序 表 的 长 度 增 1 
} 


本 算法 的 思路 是 从 头 开始 扫描 有 序 顺序 表 工 ,通过 比较 找到 插入 位 置 i, 将 data[ 门 及 后 
面 的 元 素 后 移 一 个 位 置 ,在 该 位 置 插入 元 素 e。 显 然 该 算法 的 时 间 复 杂 度 为 O(n) 。 

若 以 单 链表 存储 有 序 表 , 同 样 会 发 现 基 本 运算 算法 中 只 有 ListInsert() 算 法 与 前 面 的 单 
链表 对 应 的 运算 有 所 差异 ,其 余 都 是 相同 的 。 有 序 单 链表 的 ListInsert() 算 法 如 下 : 

void ListInsert(LinkNode * &L,ElemType e) 


{ LinkNode * pre=L, *p; 
while (pre -> next!=NULL && pre 一 next 一 data<e) 


pre 一 pre 一 > next; // 查 找 插 入 结 点 的 前 驱 结 点 pre 
p 一 (LinkNode * )malloc(sizeof(LinkNode) ) ; 
p—> data=e; // 创 建 存放 e 的 数据 结 点 p 
p 一 next 一 pre 一 > next; // 在 pre 结 点 之 后 插入 p 结 点 


Pre 一 next=p; 
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【 例 2. 14】 假设 有 两 个 有 序 表 LA 和 LB, 设 计 一 个 算法 ,将 它们 合并 成 一 个 有 序 表 
LC( 假 设 每 个 有 序 表 中 和 两 个 有 序 表 间 均 不 存在 重复 元 素 ) ,要 求 不 破坏 原 有 表 LA 和 LB。 





将 两 个 有 序 表 合并 成 一 个 有 序 表 可 以 采用 二 路 归并 算法 ,如 图 2. 28 所 示 。 其 过 程 
是 分 别 扫描 LA 和 LB 两 个 有 序 表 , 当 两 个 有 序 表 都 没有 扫描 完 时 循环 : 比较 LA、LB 的 当 
前 元 素 , 将 其 中 较 小 的 元 素 放 入 LC 中 ,再 从 较 小 元 素 所 
在 的 有 序 表 中 取 下 一 个 元 素 。 重复 这 一 过 程 直到 LA 或 -路 归并 记 一 LC 
LB 比较 完毕 ,最 后 将 未 比较 完 的 有 序 表 中 余下 的 元 素 放 
入 LC 中 。 例如 LA=(1,3,5),LB=(2,4,8,10) ,其 二 路 图 2.28 二 路 归并 示意 图 


归并 过 程 如 图 2. 29 所 示 。 
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图 2. 29 


说 明 : 本 题 要 求 不 破坏 原 有 表 LA 和 LB, 所 以 采用 复制 的 方式 生成 LC, 即 采用 建 表 方 


法 新 建 表 LC。 


采用 顺序 表 存 放 有 序 表 时 的 二 路 归并 算法 如 下 : 


void UnionList(SqList * LA,SqList * LB,SqList * &LC) 


{ inti=0,j=0,k=0; 


LC==(SqList * )malloc(sizeof(SqList)); ”// 建 立 有 序 顺 序 表 LC 
while (i<LA 一 length && j<LB—> length) 
{ if (LA—>data[i]<LB—> data0]) 

{ LC->data[fk]=LA—> data[i]; 


it 十 ;k 十 十; 
} 


else 


{ LC->data[k]=LB—> data[)]; 





EL 
} 

} 

while (i< LA 一 length) 
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//ij 分 别 为 LA、LB 的 下 标 ,k 为 LC 中 元 素 的 个 数 





//LA —> data[i]> LB —> data[ 


//LA 尚未 扫描 完 , 将 其 余 元 素 插入 LC 中 


{ LC->data[k]=LA—> data[i]; 





i 
} 
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while (j <LB —> length) //LB 尚未 扫描 完 ,将 其 余 元 素 插入 LC 中 
{ LC-—>data[k]=LB-> data[j]; 
j 十 十;k 十 十 ; 


} 
LC 一 length 一 k; 
} 


采用 单 链表 存放 有 序 表 时 的 二 路 归并 算法 如 下 : 


void UnionListl(LinkNode * LA,LinkNode * LB,LinkNode * &LC) 
{ LinkNode * pa 一 LA 一 > next, *pb=LB-—> next, *r,*s; 
LC= (LinkNode * )malloc(sizeof(LinkNode)) ; // 创 建 LC 的 头 结 点 
r=LC; //r 始终 指向 LC 的 尾 结 点 
while (pa!=NULL && pb!=NULL) 
{ if(pa—>data<pb—> data) 
{ “s 二 (LinkNode * )malloc(sizeof(LinkNode)); // 复 制 pa 所 指 结 点 
s—> data= pa 一 > data; 
r—>next=s;I=s; // 将 s 结 点 插入 到 LC 中 


pa 一 pa 一 > next; 


{ s 一 (LinkNode x )malloc(sizeof(LinkNode)); // 复 制 pb 所 指 结 点 
s—> data= pb 一 > data; 
r—>next=s;r=s; // 将 s 结 点 插入 到 LC 中 
pb 一 pb —> next; 


} 
while (pa!= NULL) 


{ s=(LinkNode * )malloc(sizeof(LinkNode) ) ; // 复 制 pa 所 指 结 点 
s—> data 一 pa —> data; 
T 一 > next 一 sir 一 si // 将 s 结 点 插入 到 LC 中 


pa 一 pa 一 > next; 
} 
while (pb!= NULL) 


{  s=(LinkNode * )malloc(sizeof(LinkNode)); // 复 制 pb 所 指 结 点 
s—> data 一 pb 一 > data; 
IT 一 > next 一 SiI 一 Si // 将 s 结 点 插入 到 LC 中 


pb=pb 一 > next; 
} 
r—>next=NULL // 尾 结 点 的 next 域 置 空 


上 述 两 个 算法 的 设计 思路 完全 相同 。 第 1 个 while 循环 在 最 坏 情 况 下 的 执行 次 数 为 
O(CListLength(LA) 十 ListLength(LB))。 第 2 个 while 循环 在 最 坏 情况 下 的 执行 次 数 为 
O(CListLength(LA))。 第 3 个 while 循环 在 最 坏 情况 下 的 执行 次 数 为 O(ListLength(LB))。 
所 以 算法 时 间 复 杂 度 为 O(ListLength(LA) 十 ListLength(LB))。 实 际 上 ,每 个 算法 都 恰好 
只 扫描 LA 和 LB 有 序 表 一 次 。 

说 明 : 两 个 长 度 分 别 为 mn 的 有 序 表 A 和 忆 采用 二 路 归并 算法 ,在 最 好 情况 下 元 素 的 
比较 次 数 为 MIN(m,n), 如 和 A 二 (1,2,3),B 二 (5,6,7,8,9) ,元 素 比 较 次 数 为 3; 在 最 坏 情况 





@00,EEE 和 ES 





下 元 素 的 比较 次 数 为 m 十 n 一 1, 如 和 A 二 (2,4,6),B 二 (1,3,5,7) ,元 素 比较 次 数 为 6。 
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【 例 2.15】 已 知 3 个 带头 结 点 的 单 链表 LA、LB 和 LC 中 的 结 点 均 依 元 素 值 递增 排列 
(假设 每 个 单 链表 不 存在 数据 值 相同 的 结 点 ,但 3 个 单 链表 中 可 能 存在 数据 值 相同 的 结 点 )， 
设计 一 个 算法 对 LA 链表 进行 如 下 操作 : 使 操作 后 的 链表 LA 中 仅 留 下 3 个 表 中 均 包 含 的 
数据 元 素 的 结 点 , 且 没 有 数据 值 相同 的 结 点 ,并 释放 LA 中 所 有 的 无 用 结 点 。 要 求 算法 的 时 
间 复 杂 度 为 OCm 十 n 十 p) ,其 中 六 和 分 别 为 3 个 表 的 长 度 。 

先 以 单 链表 LA 的 头 结 点 作为 一 个 空 表 ,r 指向 这 个 新 建 单 链表 的 尾 结 点 。 以 pa 
扫描 单 链表 LA 的 数据 结 点 ,判断 它 是 否 在 单 链表 LB 和 LC 中 , 若 同时 在 LB 和 LC 中 , 表 
示 pa 所 指 结 点 是 公共 元 素 , 则 将 其 链接 到 所 指 结 点 之 后 ,否则 删除 之 。 算 法 如 下 : 


void Commnode(LinkNode * &LA,LinkNode * LB,LinkNode * LC) 
{ LinkNode * pa=LA—>next, * pb=LB—> next, * pc=LC—>next, *q, *r; 


LA —> next=NULL; // 此 时 LA 作为 新 建 单 链表 的 头 结 点 
r=LA; //r 始终 指向 新 单 链表 的 尾 结 点 

while (pa!= NULL) // 查 找 均 包含 的 公共 结 点 并 建立 新 链表 
{ while (pb!=NULL && pa 一 > data> pb —> data) //pa 结 点 与 LB 中 的 pb 结 点 进行 比较 


pb=pb 一 next; 

while (pec! 二 NULL && pa 一 > data> pc -> data) //pa 结 点 与 LC 中 的 pc 结 点 进行 比较 
Pc= pe -> next; 

if (pb!l=NULL && pc!=NULL &&. pa -> data 一 一 pb 一 > data 


R&B. pa -> data 一 一 pc 一 > data) // 若 pa 结 点 是 公共 结 点 
{ rr 一 > next 一 pai // 将 pa 结 点 插入 到 LA 中 
r=pa; 
pa 一 pa 一 > next; //pa 移 到 下 一 个 结 点 
} 
else // 若 pa 结 点 不 是 公共 结 点 , 则 删除 之 
{ gq=pa; 
pa 一 pa 一 > next; //pa 移 到 下 一 个 结 点 
free(q); // 释 放 非 公共 结 点 
} 
} 
r—>next=NULL; // 尾 结 点 的 next 域 置 空 


} 


注意 : 本 算法 实际 上 也 是 利用 尾 插 法 新 建 链表 的 过 程 。 

在 上 述 算法 中 ,指向 LA、LB、LC 单 链表 的 指针 pa、pb、pc 都 没有 出 现 回 溯 过 程 , 即 每 个 
单 链 表 均 只 扫描 一 遍 , 所 以 算法 的 时 间 复 杂 度 为 OGm 十 n 十 p)。 

【 例 2. 16】 已 知 一 个 有 序 单 链表 工 ( 允 许 出 现 值 域 重复 的 结 点 ) ,设计 一 个 高 效 算法 删 





除 值 域 重复 的 结 点 ,并 分 析 算 法 的 时 间 复 杂 度 。 








由 于 是 有 序 单 链表 ,所 以 相同 值 域 的 结 点 都 是 相 邻 的 。 用 p 扫描 递增 单 链表 .车 p 
所 指 结 点 的 值 域 等 于 其 后 继 点 的 值 域 , 则 删除 后 者 。 算 法 如 下 : 的 - 折 





void dels(LinkNode * &L) 
{ LinkNode * p=L -> next, *q; 
while (p—> next!=NULL) 
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{ 站 (pp 一 data 一 一 p 一 next 一 data) // 找 到 重复 值 的 结 点 

{ gq=p—>next; //q 指向 这 个 重复 值 的 结 点 
p 一 next=q—> next; // 删 除 q 结 点 
free(q); 

} 

else // 不 是 重复 结 点 ,p 指针 下 移 
p 王 p 一 next; 


本 算法 的 时 间 复 杂 度 为 O(n) ,其 中 为 有 序 单 链表 LL 中 数据 结 点 的 个 数 。 

【 例 2. 17】 一 个 长 度 为 n(n 三 1) 的 升序 序列 S, 处 在 第 n/2 个 位 置 的 数 称 为 S 的 中 位 
数 。 例 如 , 若 序列 Si=(11,13,15.17,19). 则 Si 的 中 位 数 是 15。 两 个 序列 的 中 位 数 是 含 它 
们 所 有 元 素 的 升序 序列 的 中 位 数 。 例 如 , 若 S:=(2.4,6,8.20), 则 S; 和 Ss 的 中 位 数 是 11 。 
现 有 两 个 等 长 的 升序 序列 A 和 B, 设 计 一 个 在 时 间 和 空间 两 方面 都 尽 可 能 高 效 的 算法 , 找 
出 两 个 序列 A 和 B 的 中 位 数 。 假 设 升 序 序 列 采用 顺序 表 存 储 。 

当 升 序 序 列 采用 顺序 表 存储 时 ,一 个 升序 序列 S 的 中 位 数 就 是 S 一 > dataLS 一 > 
length/2] 元 素 ,求解 算法 十 分 简单 ; 而 S 和 Ss 两 个 等 长 升序 序列 的 中 位 数 是 将 它们 二 路 
归并 后 的 一 个 升序 序列 S 的 中 位 数 。 实 际 上 不 需要 求 出 S 的 全 部 元 素 ,用 k 记录 当前 归并 
的 元 素 个 数 , 当 k= 二 Sl 一 > length 时 进行 归并 的 那个 元 素 就 是 中 位 数 。 求 两 个 等 长 有 序 顺序 





表 A、B 中 位 数 的 算法 如 下 : 


ElemType M_Search(SqList * A, SqList * B) 
{ inti=0, j=0, k=0; 
while (i< A —> length && j<B 一 length) 
We 
if (A 一 data[i]<B—> data0]) 
{ if(k==A—>length) 
return A -> data[i] ; 
中 去 司 
} 
else 
{ if(k==B->length) 
return 了 一 > data[j]; 
) 昌 是 置 


//A、B 的 长 度 相 同 


// 两 个 序列 均 没有 扫描 完 

// 当 前 归并 的 元 素 个 数 增 1 

// 归 并 较 小 的 元 素 A 一 > data[j 

// 若 当前 归并 的 元 素 是 第 n 个 元 素 
// 返 回 A 一 > data[ 


// 归 并 较 小 的 元 素 B -> data[] 
// 若 当前 归并 的 元 素 是 第 n 个 元 素 
// 返 回 B-> dataD] 


上 述 算法 的 时 间 复 杂 度 为 O(0z) 、 空 间 复杂 度 为 O(1) ,是 高 效 的 算法 ,其 中 ?为 等 长 有 


序 顺 序 表 A、B 中 的 元 素 个 数 。 


7) 








本 章 的 基本 学 习 要 点 如 下 : 
(1) 理解 线性 表 的 逻辑 结构 特性 。 


(2) 掌握 线性 表 的 两 种 存储 方法 , 即 顺序 表 和 链表 ,体会 这 两 种 存储 结构 之 间 的 差异 。 


(3) 掌握 顺序 表 上 各 种 基本 运算 的 实现 过 程 和 顺序 表 的 通用 
(4) 掌握 单 链表 上 各 种 基本 运算 的 实现 过 程 和 单 链表 的 通用 
(5) 掌握 双 链 表 的 特点 和 双 和 链表 的 通用 算法 设计 方法 。 


算法 设计 方法 。 
算法 设计 方法 。 





(6) 掌握 循环 链表 的 特点 以 及 循环 链表 和 对 应 非 循环 链表 的 


差别 。 


(7) 掌握 有 序 表 的 特点 和 二 路 归并 算法 ,以 及 利用 有 序 性 设计 高 效 的 算法 。 


(8) 综合 运用 线性 表 解 决 一 些 复杂 的 实际 问题 。 
一 练习 题 2 -一 一 


1. 简 述 线性 表 的 两 种 存储 结构 的 主要 特点 。 

2. 简 述 单 链表 设置 头 结 点 的 主要 作用 。 
.假设 某 个 含有 个 元 素 的 线性 表 有 以 下 运算 : 
.查找 序号 为 i(1 志 i 三 n) 的 元 素 ; 
.查找 第 一 个 值 为 zx 的 元 素 ; 

.插入 新 元 素 作为 第 一 个 元 素 ; 

.插入 新 元 素 作为 最 后 一 个 元 素 ; 

插入 第 i(2 达 i 过 n) 个 元 素 ; 
.删除 第 一 个 元 素 ; 

. 删除 最 后 一 个 元 素 ; 

. 删除 第 i(2 达 i 过 nn) 个 元 素 。 

现 设 计 该 线性 表 的 以 下 存储 结构 : 

O 顺序 表 ; 

@ 带头 结 点 的 单 链表 ; 

@ 带头 结 点 的 循环 单 链 表 ; 

钱 不 带头 结 点 仅 有 尾 结 点 指针 标识 的 循环 单 链 表 ; 
@ 带头 结 点 的 双 链 表 ; 

带头 结 点 的 循环 双 链 表 。 


ww 


二 二 三 = 三 电导 








数据 结构 教程 @O0 


指出 各 种 存储 结构 中 对 应 运算 算法 的 时 间 复 杂 度 。 
4. 对 于 顺序 表 工 ,指出 以 下 算法 的 功能 。 


void fun(SqList * &L) 
{ inti,j=0; 
for (i=1;i<L —> length;i+ 十 ) 
if (L -> data[]>L -> dataD]) 
i 
for (i=j;i<L —> length 一 1;i 十 十 ) 
工 一 data[i] =L —> data[i+1]; 
L—> length 一 一 ; 
4 


5. 对 于 顺序 表 工 ,指出 以 下 算法 的 功能 。 


void fun(SqList * &L,ElemType x) 
{ inti,j=0; 
for (i=1;i<L -> length;it+++) 
if (L —> data[]<=L —> data0]) 
i 
for (i=L 一 > length;i>j;i——) 
Tell 
L—>dataD]=x; 
L 一 length 十 十 ; 
} 


6. 有 人 设计 以 下 算法 用 于 删除 整数 顺序 表 工 中 所 有 值 在 [zx,y] 范 围 内 的 元 素 ,该 算法 
显然 不 是 高 效 的 ,请 设计 一 个 同样 功能 的 高 效 算法 。 


void fun(SqList * &L,ElemType x) 
{ intij; 
for (i=0;i<L —> length;i+ 十 ) 
if (L —> data[]>=x && L -> data[]<=y) 
{ for (j=i;j<L ->1length 一 1;j 十 十 ) 
L-—> dataD]=L 一 data[j+1]; 
L—> length——; 


} 


7. 设计 一 个 算法 ,将 元 素 工 插入 到 一 个 有 序 ( 从 小 到 大 排序 ) 顺 序 表 的 适当 位 置 ,并 保 
持 有 序 性 。 

8. 假设 一 个 顺序 表 工 中 的 所 有 元 素 为 整数 ,设计 一 个 算法 调整 该 顺序 表 , 使 其 中 所 有 
小 于 零 的 元 素 放 在 所 有 大 于 等 于 零 的 元 素 的 前 面 。 

9. 对 于 不 带头 结 点 的 单 链表 工 1 ,其 结 点 类 型 为 LinkNode, 指 出 以 下 算法 的 功能 。 


void funl (LinkNode * &L1,LinkNode * &L2) 


六 


[7 
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LinkNode * p 一 L1; 

while (p!=NULL) 

Em 
p=p—> next; 

} 

p=L]1; 

for (i 王 1;i< n/2;i 十 十 ) 
p=p—> next; 

L2 王 p 一 next; 

p 一 > next=NULL:; 

} 


10. 在 结 点 类 型 为 DLinkNode 的 双 链 表 中 给 出 将 p 所 指 结 点 ( 非 尾 结 点 ) 与 其 后 继 结 
点 交换 的 操作 。 

11. 有 一 个 线性 表 (a ,as,…，,a,), 其 中 n 宇 2, 采 用 带头 结 点 的 单 链表 存储 , 头 指 针 为 
了 ,每 个 结 点 存放 线性 表 中 的 一 个 元 素 , 结 点 类 型 为 (data,next), 现 查找 某 个 元 素 值 等 于 工 
的 结 点 指针 , 若 不 存在 这 样 的 结 点 返回 NULL。 分 别 写 出 下 面 3 种 情况 的 查找 语句 ,要 求 
时 间 尽 量 少 。 

(1) 线性 表 中 的 元 素 无 序 。 

(2) 线性 表 中 的 元 素 按 递增 有 序 。 

(3) 线性 表 中 的 元 素 按 递减 有 序 。 

12. 设计 一 个 算法 ,将 一 个 带头 结 点 的 数据 域 依次 为 a1 、as、…、a, (nn 三 3) 的 单 链表 的 所 
有 结 点 逆 置 , 即 第 1 个 结 点 的 数据 域 变 为 a, ,第 2 个 结 点 的 数据 域 变 为 a,-1…… 尾 结 点 的 数 
据 域 变 为 w 。 

13. 一 个 线性 表 (a ,as，…,a,)(n 记 3) 采 用 带头 结 点 的 单 链表 工 存储 ,设计 一 个 高 效 算 
法 求 中 间 位 置 的 元 素 ( 即 序号 为 |n/2 | 的 元 素 )。 

14. 设计 一 个 算法 在 带头 结 点 的 非 空 单 链表 工 中 第 一 个 最 大 值 结 点 (最 大 值 结 点 可 能 
有 多 个 ) 之 前 插入 一 个 值 为 z 的 结 点 。 

15. 设 有 一 个 带头 结 点 的 单 链表 工 , 结 点 的 结构 为 (data, next) ,其 中 data 为 整数 元 素 ， 
next 为 后 继 结 点 的 指针 。 设 计 一 个 算法 ,首先 按 递减 次 序 输出 该 单 链表 中 各 结 点 的 数据 元 
素 ,然后 释放 所 有 结 点 占用 的 存储 空间 ,并 要 求 算法 的 空间 复杂 度 为 0(1)。 

16. 设 有 一 个 双 链 表 及 ,每 个 结 点 中 除了 有 prior、data 和 next 几 个 域 以 外 ,还 有 一 个 访 
问 频 度 域 freq, 在 链表 被 启用 之 前 ,其 值 均 初始 化 为 零 。 每 当 进 行 LocateNode(h,z) 运 算 





时 , 令 元 素 值 为 z 的 结 点 中 freq 域 的 值 加 1, 并 调整 表 中 结 点 的 次 序 ,使 其 按 访问 频 度 的 递 mm 


减 次 序 排列 ,以 便 使 频繁 访问 的 结 点 总 是 靠近 表 头 。 试 写 一 个 符合 上 述 要 求 的 LocateNode 
运算 的 算法 。 

17. 设 ha 二 (qs,as sas) 和 hb 二 (51,6:，,…,b,) 是 两 个 带头 结 点 的 循环 单 链表 ,设计 
一 个 算法 将 这 两 个 表 合并 为 带头 结 点 的 循环 单 链表 hc。 

18. 设 两 个 非 空 线性 表 分 别 用 带头 结 点 的 循环 双 链 表 ha 和 hb 表示 ,设计 一 个 算法 
Insert(ha,hb,z) ,其 功能 是 当 ;一 0 时 将 hb 插入 到 ha 的 前 面 ; 当 i>0 时 将 hb 插入 到 ha 中 
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第 i 个 结 点 的 后 面 ; 当 i 大 于 等 于 ha 的 长 度 时 将 hb 插入 到 ha 的 后 面 。 

19. 用 带头 结 点 的 单 链表 表示 整数 集合 ,完成 以 下 算法 并 分 析 时 间 复 杂 度 : 

(1) 设计 一 个 算法 求 两 个 集合 A 和 B 的 并 集运 算 , 即 C 二 AUB, 要 求 不 破坏 原 有 的 单 
链表 A 和 B。 

(2) 假设 集合 中 的 元 素 按 递增 排列 ,设计 一 个 高 效 算法 求 两 个 集合 A 和 B 的 并 集运 
算 , 即 C=AUB, 要 求 不 破坏 原 有 的 单 链表 A 和 B。 

20. 用 带头 结 点 的 单 链表 表示 整数 集合 ,完成 以 下 算法 并 分 析 时 间 复 杂 度 : 

(1) 设计 一 个 算法 求 两 个 集合 A 和 B 的 差 集运 算 , 即 C= 二 A 一 B, 要 求 算 法 的 空间 复杂 
度 为 0(1) ,并 释放 单 链表 A 和 B 中 不 需要 的 结 点 。 

(2) 假设 集合 中 的 元 素 按 递增 排列 ,设计 一 个 高 效 算法 求 两 个 集合 A 和 B 的 差 集运 
算 , 即 C=A 一 B, 要 求 算法 的 空间 复杂 度 为 0(1) ,并 释放 单 链 表 A 和 B 中 不 需要 的 结 点 。 


一 于- 上 机 实验 题 2 一 和 一 


他 验证 性 实验 

实验 题 1: 实现 顺序 表 的 各 种 基本 运算 的 算法 

目的 : 领会 顺序 表 存储 结构 和 掌握 顺序 表 中 的 各 种 基本 运算 算法 设计 。 

内 容 : 编写 一 个 程序 sqlist. cpp, 实 现 顺 序 表 的 各 种 基本 运算 和 整体 建 表 算 法 (假设 顺序 表 
的 元 素 类 型 ElemType 为 char) ,并 在 此 基础 上 设计 一 个 程序 exp2-1. cpp 完成 以 下 功能 。 

(1) 初始 化 顺序 表 工 。 

(2) 依次 插入 a、b、c、d、e 元 素 。 

(3) 输出 顺序 表 工 。 

(4) 输出 顺序 表 工 的 长 度 。 

(5) 判断 顺序 表 工 是 否 为 空 。 

(6) 输出 顺序 表 工 的 第 3 个 元 素 。 

(7) 输出 元 素 a 的 位 置 。 

(8) 在 第 4 个 元 素 位 置 上 插入 / 元素。 

(9) 输出 顺序 表 工 。 

(10) 删除 顺序 表 工 的 第 3 个 元 素 。 

(11) 输出 顺序 表 工 。 

(12) 释放 顺序 表 工 。 


实验 题 2: 实现 单 链表 的 各 种 基本 运算 的 算法 

目的 : 领会 单 链表 存储 结构 和 掌握 单 链表 中 的 各 种 基本 运算 算法 设计 。 

内 容 : 编写 一 个 程序 linklist. cpp, 实 现 单 链表 的 各 种 基本 运算 和 整体 建 表 算法 (假设 单 
链表 的 元 素 类 型 ElemType 为 char) ,并 在 此 基础 上 设计 一 个 程序 exp2-2. cpp 完成 以 下 功能 。 

(1) 初始 化 单 链表 h。 

(2) 依次 采用 尾 插 法 插入 a、b、c、d、e 元 素 。 

(3) 输出 单 链 表 。 
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(4) 输出 单 链表 的 长 度 。 

(5) 判断 单 链表 凡是 否 为 空 。 

(6) 输出 单 链表 有 的 第 3 个 元 素 。 

(7) 输出 元 素 a 的 位 置 。 

(8) 在 第 4 个 元 素 位 置 上 插入 f 元 素 。 
(9) 输出 单 链 表 彤 。 

(10) 删除 单 链表 六 的 第 3 个 元 素 。 
(11) 输出 单 链表 有。 

(12) 释放 单 链表 hh。 


实验 题 3: 实现 双 链 表 的 各 种 基本 运算 的 算法 

目的 : 领会 双 链 表 存储 结构 和 掌握 双 链 表 中 的 各 种 基本 运算 算法 设计 。 

内 容 : 编写 一 个 程序 dlinklist. cpp, 实 现 双 链表 的 各 种 基本 运算 和 整体 建 表 算法 (假设 
双 链 表 的 元 素 类 型 ElemType 为 char) ,并 在 此 基础 上 设计 一 个 程序 exp2-3. cpp 完成 以 下 
功能 。 

(1) 初始 化 双 链 表 h。 

(2) 依次 采用 尾 插 法 插入 a、b、c、d、e 元 素 。 

(3) 输出 双 链表 /。 

(4) 输出 双 链 表 六 的 长 度 。 

(5) 判断 双 链 表 是否 为 空 。 

(6) 输出 双 链 表 的 第 3 个 元 素 。 

(7) 输出 元 素 a 的 位 置 。 

(8) 在 第 4 个 元 素 位 置 上 插入 / 元素 。 

(9) 输出 双 链 表 h。 

(10) 删除 双 链 表 有 的 第 3 个 元 素 。 

(11) 输出 双 链 表 h。 

(12) 释放 双 和 链表。 


实验 题 4: 实现 循环 单 链 表 的 各 种 基本 运算 的 算法 

目的 : 领会 循环 单 链表 存储 结构 和 掌握 循环 单 链表 中 的 各 种 基本 运算 算法 设计 。 

内 容 : 编写 一 个 程序 clinklist. cpp, 实 现 循环 单 链表 的 各 种 基本 运算 和 整体 建 表 算 法 
(假设 循环 单 链表 的 元 素 类 型 ElemType 为 char) ,并 在 此 基础 上 设计 一 个 程序 exp2-4. cpp 
完成 以 下 功能 。 





(1) 初始 化 循环 单 链表 hh。 mm 


(2) 依次 采用 尾 插 法 插入 a、b、c、d、e 元 素 。 
(3) 输出 循环 单 链表 h。 

(4) 输出 循环 单 链表 hh 的 长 度 。 

(5) 判断 循环 单 链 表 hh 是 否 为 空 。 

(6) 输出 循环 单 链表 的 第 3 个 元 素 。 

(7) 输出 元 素 a 的 位 置 。 
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(8) 在 第 4 个 元 素 位 置 上 插入 f 元 素 。 
(9) 输出 循环 单 链 表 h。 
(10) 删除 循环 单 链表 的 第 3 个 元 素 。 
(11) 输出 循环 单 链表 及。 
(12) 释放 循环 单 链表 几 。 


实验 题 5: 实现 循环 双 链 表 的 各 种 基本 运算 的 算法 

目的 : 领会 循环 双 链 表 存 储 结构 和 掌握 循环 双 链 表 中 的 各 种 基本 运算 算法 设计 。 

内 容 : 编写 一 个 程序 cdlinklist. cpp, 实 现 循环 双 链 表 的 各 种 基本 运算 和 整体 建 表 算 法 
(假设 循环 双 链 表 的 元 素 类 型 ElemType 为 char) ,并 在 此 基础 上 设计 一 个 程序 exp2-5. cpp 
完成 以 下 功能 。 

(1) 初始 化 循环 双 链 表 hh。 

(2) 依次 采用 尾 插 法 插入 a、b、c、d、e 元 素 。 

(3) 输出 循环 双 链 表 h。 

(4) 输出 循环 双 链 表 有 h 的 长 度 。 

(5) 判断 循环 双 链 表 h 是 否 为 空 。 

(6) 输出 循环 双 链 表 的 第 3 个 元 素 。 

(7) 输出 元 素 a 的 位 置 。 

(8) 在 第 4 个 元 素 位 置 上 插入 /元素 。 

(9) 输出 循环 双 链 表 h。 

(10) 删除 循环 双 链 表 h 的 第 3 个 元 素 。 

(11) 输出 循环 双 链 表 h。 

(12) 释放 循环 双 链 表 h。 

戎 设计 性 实验 

实验 题 6: 将 单 链表 按 基准 划分 

目的 : 掌握 单 链表 的 应 用 和 算法 设计 。 

内 容 : 编写 一 个 程序 exp2-6. cpp, 以 给 定 值 x 为 基准 将 单 链 表 分 割 为 两 部 分 ,所 有 小 于 
Zz 的 结 点 排 在 大 于 或 等 于 xz 的 结 点 之 前 。 

实验 题 7: 将 两 个 单 链表 合并 为 一 个 单 链表 

目的 : 掌握 单 链表 的 应 用 和 算法 设计 。 

内 容 : 编写 一 个 程序 exp2-7. cpp 实现 这 样 的 功能 ,LL = (xi,zx2,… ,zx,) ,Ls 二 (Yi, 
yz，*… ,ym) ,它们 是 两 个 线性 表 , 采 用 带头 结 点 的 单 链表 存储 ,设计 一 个 算法 合并 Li、L;, 结 
果 放 在 线性 表 L 中 。 要 求 如 下 : 


Ls = (zi9y1 9 T2929 Tm Yn Tmtls "Ta) mn 





Ls = (Tioy Tay Toy Ya Ym) Mm>n 


Ls 仍 采用 单 链 表 存 储 , 算 法 的 空间 复杂 度 为 O(1) 。 


实验 题 8: 求 集合 (用 单 链表 表示 ) 的 并 、 交 和 差 运算 
目的 : 掌握 单 链表 的 应 用 和 有 序 单 链表 的 二 路 归并 算法 设计 。 


所 DOxdRRE 





内 容 , 编写 一 个 程序 exp2-8. cpp, 采 用 单 链表 表示 集合 (假设 同一 个 集合 中 不 存在 重复 
的 元 素 ) ,将 其 按 递增 方式 排序 ,构成 有 序 单 链表 ,并 求 这 样 的 两 个 集合 的 并 、 交 和 差 。 
实验 题 9: 求 两 个 多 项 式 的 相 加 运算 
目的 。 掌握 线性 表 的 应 用 和 有 序 单 链表 的 二 路 归并 算法 设计 。 
内 容 : 编写 一 个 程序 exp2-9. cpp, 用 单 链表 存储 一 元 多 项 式 ,并 实现 两 个 多 项 式 的 相 加 
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综合 性 实验 
实验 题 10: 求 两 个 多 项 式 的 相 乘 运算 
目的 : 深入 掌握 单 链表 应 用 的 算法 设计 。 
内 容 : 编写 一 个 程序 exp2-10. cpp, 用 单 链 表 存 储 一 元 多 项 式 , 并 实现 两 个 多 项 式 的 相 
乘 运算 。 
实验 题 11: 职工 信息 的 综合 运算 
目的 : 深入 掌握 单 链表 应 用 的 算法 设计 。 
内 容 : 设 有 一 个 职工 文件 emp. dat, 每 个 职工 记录 包含 职工 编号 (no) 、 姓 名 (name) 、 部 
门 号 (depno) 和 工资 数 (salary) 信 息 。 设 计 一 个 程序 exp2-11. cpp 完成 以 下 功能 : 
(1) 从 emp. dat 文件 中 读 出 职工 记录 ,并 建立 一 个 带头 结 点 的 单 链表 工 。 
(2) 输入 一 个 职工 记录 。 
(3) 显示 所 有 职工 记录 。 
(4) 按 编号 no 对 所 有 职工 记录 进行 递增 排序 。 
(5) 按 部 门 号 depno 对 所 有 职工 记录 进行 递增 排序 。 
(6) 按 工 资 数 salary 对 所 有 职工 记录 进行 递增 排序 。 
(7) 删除 指定 职工 号 的 职工 记录 。 
(8) 删除 职工 文件 中 的 全 部 记录 。 
(9) 将 单 链表 工 中 的 所 有 职工 记录 存储 到 职工 文件 emp. dat 中 。 


实验 题 12: 用 单 链表 实现 两 个 大 整数 的 相 加 运算 

目的 : 深入 掌握 单 链表 应 用 的 算法 设计 。 

内 容 : 编写 一 个 程序 exp2-12. cpp, 完 成 以 下 功能 。 

(1) 将 用 户 输入 的 十 进 制 整数 字符 串 转化 为 带头 结 点 的 单 链表 ,每 个 结 点 存放 一 个 整 
数位 。 
(2) 求 两 个 整数 单 链表 相 加 的 结果 单 链表 。 

(3) 求 结果 单 链表 的 中 间 位 ,如 123 的 中 间 位 为 2.1234 的 中 间 位 为 2。 








从 组 成 元 素 的 逻辑 关系 看 , 栈 和 队列 都 属于 线性 结构 。 栈 和 队 
列 与 线性 表 的 不 同 之 处 在 于 它们 的 相关 运算 具有 一 些 特殊 性 。 更 
准确 地 说 , 一 般 线 性 表 上 的 插入 、 删 除 运算 不 受 限 制 , 而 栈 和 队列 上 
的 插入 、 删除 运算 均 受 某 种 特殊 限制 , 因此 栈 和 队列 也 称 为 操作 受 
限 的 线性 表 。 

本 章 介绍 栈 和 队列 的 基本 概念 存储 结构 基本 运算 算法 设计 
和 应 用 实例 。 


Bee 


栈 是 一 种 常用 而 且 重 要 的 数据 结构 之 一 ,如 用 于 保存 函数 调用 时 所 需要 的 信息 ,通常 在 
将 递归 算法 转换 成 非 递归 算法 时 需要 使 用 到 栈 。 本 节 主要 讨论 栈 及 其 应 用 。 


311 栈 的 定义 


栈 (stack) 是 一 种 只 能 在 一 端 进行 插入 或 删除 操作 的 线性 表 。 表 中 允许 进行 插入 、 删 除 
操作 的 一 端 称 为 栈 项 (top) , 表 的 另 一 端 称 为 栈 底 (bottom) ,如 图 3. 
1 所 示 。 栈 项 的 当前 位 置 是 动态 的 , 栈 顶 的 当前 位 置 由 一 个 被 称 为 进 栈 \ / 出 楼 
栈 顶 指针 的 位 置 指示 器 来 指示 。 当 栈 中 没有 数据 元 素 时 称 为 空 栈 。 
栈 的 插入 操作 通常 称 为 进 栈 或 入 栈 (push) , 栈 的 删除 操作 通常 称 为 mw | 栈 项 
出 栈 或 退 栈 (pop) 。 

栈 的 主要 特点 是 “后 进 先 出 (Last In First Out,LIFO) , 即 后进 
栈 的 元 素 先 出 栈 。 每 次 进 栈 的 数据 元 素 都 放 在 原来 栈 顶 元 素 之 前 


成 为 新 的 栈 顶 元 素 ,每 次 出 栈 的 数据 元 素 都 是 当前 栈 顶 元 素 。 栈 也 图 3.1 栈 示意 图 
称 为 后 进 先 出 表 。 


例如 ,若干 个 人 走 进 一 个 死胡同 ,假设 该 死胡同 的 宽度 恰好 只 够 一 个 人 
进出 ,那么 走出 死胡同 的 顺序 和 走 进 的 顺序 正好 相反 。 这 个 死胡同 就 是 一 
个 栈 。 

栈 抽 象 数据 类 型 的 定义 如 下 : 








q_ | 栈 底 
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ADT Stack 
{ ”数据 对 象 : 
D={ a;| 1<i<n,n 之 0,a; 为 ElemType 类 型 } //ElemType 是 自 定义 类 型 标识 符 
数据 关系 : 
R={<ai,an> | aivain € D,i=1,.,n—1) 
基本 运算 : 
InitStack( &s) : 初始 化 栈 , 构 造 一 个 空 栈 *。 
DestroyStack( &s) : 销毁 栈 ,释放 栈 * 占用 的 存储 空间 。 
StackEmpty(s) : 判断 栈 是 否 为 空 , 若 栈 * 为 空 , 则 返回 真 ; 否则 返回 假 。 
Push( &s,e): 进 栈 ,将 元 素 e 插 入 到 栈 s 中 作为 栈 顶 元 素 。 
Pop(&s, &e): 出 栈 , 从 栈 * 中 删除 栈 顶 元 素 ,并 将 其 值 赋 给 e。 
GetTop(s, &e) : 取 栈 顶 元 素 ,返回 当前 的 栈 顶 元 素 , 并 将 其 值 赋 给 e。 
} 





【 例 3.1】 若 元 素 的 进 栈 序列 为 1234, 能 否 得 到 3142 的 出 栈 序列 ? 

为 了 让 3 作为 第 一 个 出 栈 元 素 ,1、2 先进 栈 , 此 时 要 么 2 出 栈 , 要 么 4 进 栈 后 出 栈 ， 
出 栈 的 第 2 个 元 素 不 可 能 是 1, 所 以 得 不 到 3142 的 出 栈 序 列 。 

【 例 3.2】 用 S 表 示 进 栈 操作 、X 表示 出 栈 操作 ,车 元 素 的 进 栈 顺序 为 1234, 为 了 得 到 
1342 的 出 栈 序 列 , 给 出 相应 的 S 和 XX 操作 串 。 

为 了 得 到 1342 的 出 栈 序列 ,其 操作 过 程 是 1 进 栈 ,1 出 栈 ,2 进 栈 ,3 进 栈 ,3 出 栈 ， 
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4 进 栈 ,4 出 栈 ,2 出 栈 。 因 此 相应 的 S 和 X 操 作 串 为 SXSSXSXX。 
说 明 : ”个 不 同 的 元 素 通过 一 个 栈 产生 的 出 乒 序列 的 个 数 为 -二 TC5。 合 如 mn 人 时 ,出 
栈 序列 的 个 数 等 于 14。 


进 栈 序列 出 栈 序列 【 例 3.3】 一 个 栈 的 进 栈 序 列 为 1,2,…,n, 通 过 一 个 

n 54 3 栈 得 到 出 栈 序列 pi ,ps，… ,ps (Pi,ps，…… ,ps 是 1,2,*…,n 
个 1 ,| 的 一 种 排列 ) 。 若 p1 二 3, 则 ps 可 能 取 值 的 个 数 是 多 少 ? 

5 国 为 了 让 3 作为 第 一 个 出 栈 元 素 ,将 1.2、3 依次 进 


栈 ,3 出 栈 ,此 时 如 图 3.2 所 示 。 之 后 可 以 让 2 出 栈 , 户 一 2， 
也 可 以 让 4 进 栈 再 出 栈 ,ps 二 4, 也 可 以 让 4、5 进 栈 再 出 
栈 ,ps 二 5,…, 所 以 ps 可 以 是 2,4,5,…,n, 不 可 能 是 1 和 
3, 即 ps 可 能 取 值 的 个 数 是 n 一 2。 


312 栈 的 顺序 存储 结构 及 其 基本 运算 的 实现 


栈 中 数据 元 素 的 逻辑 关系 呈 线 性 关系 ,所 以 栈 可 以 像 线性 表 一 样 采用 
顺序 存储 结构 进行 存储 , 即 分 配 一 块 连续 的 存储 空间 来 存放 栈 中 元 素 , 并 用 
一 个 变量 (如 top) 指 向 当前 的 栈 顶 元 素 以 反映 栈 中 元 素 的 变化 。 采 用 顺序 
存储 结构 的 栈 称 为 顺序 栈 (sequential stack) 。 

假设 栈 的 元 素 个 数 最 大 不 超过 正 整数 MaxSize, 所 有 的 元 素 都 具有 同一 数据 类 型 , 即 
ElemType, 可 用 下 列 方式 来 声明 顺序 栈 的 类 型 SqStack: 


一 个 栈 
图 3.2 栈 操作 的 一 个 时 刻 

















typedef struct 


{ ElemType data[MaxSize] ; // 存 放 栈 中 的 数据 元 素 
int top; // 栈 顶 指针 , 即 存放 栈 顶 元 素 在 data 数组 中 的 下 标 
} SqStack; // 顺 序 栈 类 型 


栈 到 顺序 栈 的 映射 过 程 如 图 3. 3 所 示 。 本 节 采 用 栈 指针 s( 不 同 于 栈 顶 指针 top) 的 方 
式 创 建 和 使 用 顺序 栈 ,如 图 3.4 所 示 。 












































顺序 栈 
栈 直接 映射 0 1 i 7-1… MaxSize-1 
oo | 一 a | 四 |…|a|…|w|… 和 | … nl 
= 








3.3” 栈 到 顺序 栈 的 映射 


图 3.5 是 一 个 顺序 栈 操作 示意 图 。 图 3. 5(a) 是 初始 情 i 
况 , 它 是 一 个 空 栈 ; 图 3. 5(b) 表 示 元 素 a 进 栈 以 后 的 状态 ; 磊 序 材 
图 3. 5(c) 表 示 元 素 bc.d 进 栈 以 后 的 状态 ; 图 3. 5(d) 表 示 元 
素 d 出 栈 以 后 的 状态 。 

综 上 所 述 , 对 于 s 所 指 的 顺序 栈 ( 即 顺序 栈 s) ,初始 时 设置 ;一 > top 一 一 1, 可 以 归纳 出 
对 后 面 算法 设计 来 说 非常 重要 的 4 个 要 素 。 














3.4 顺序 栈 指针 s 
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图 3.5 栈 操作 示意 图 


栈 空 的 条 件 : s 一 > top=== 一 1。 
栈 满 的 条 件 : s 一 > top 二 二 MaxSize 一 1(data 数组 的 最 大 下 标 ) 。 
元 素 e 的 进 栈 操作 : 先 将 栈 顶 指针 top 增 1, 然 后 将 元 素 e 放 在 栈 顶 指针 处 。 
出 栈 操作 : 先 将 栈 顶 指针 top 处 的 元 素 取出 放 在 e 中 ,然后 将 栈 顶 指针 减 1 。 

在 顺序 栈 上 对 应 栈 的 基本 运算 算法 设计 如 下 。 

1) 初始 化 栈 initStack(&s) 

该 运算 创建 一 个 空 栈 , 由 s 指向 它 。 实 际 上 就 是 分 配 一 个 顺序 栈 空间 ,并 将 栈 顶 指针 设 
置 为 一 1。 算 法 如 下 : 


void InitStack(SqStack * &s) 
{ “s 二 (SqStack * )malloc(sizeof(SqStack)); // 分 配 一 个 顺序 栈 空间 , 首 地 址 存放 在 s 中 
s—>top=—1; // 栈 顶 指针 置 为 一 1 


2) 销毁 栈 DestroyStack(&s) 

该 运算 释放 顺序 栈 s 占用 的 存储 空间 。 算 法 如 下 : 
void DestroyStack(SqStack * &s) 

{ 


free(s); 


} 

3) 判断 栈 是 否 为 空 StackEmpty(s) 

该 运算 实际 上 用 于 判断 条 件 ;一 > top 二 二 一 1 是 否 成 立 。 算 法 如 下 : 
bool StackEmpty(SqStack * s) 

{ 


return(s 一 top 一 一 一 1); 
} 
4) 进 栈 Push(&s .e) 


该 运算 的 执行 过 程 是 ,在 栈 不 满 的 条 件 下 先 将 栈 项 指针 增 1, 然 后 在 该 位 置 上 搬入 元 素 
e, 并 返回 真 ; 否则 返回 假 。 算 法 如 下 : 


bool Push(SqStack * &s,ElemType e) 
{ if(s->top==MaxSize—1) // 栈 满 的 情况 , 即 栈 上 溢出 


return false; 
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s—>top 二 十 ; // 栈 项 指针 增 1 
s—>data[s—> top]=e; // 元 素 e 放 在 栈 顶 指针 处 
return true; 


} 


5) 出 栈 Pop(&s ,&e) 
该 运算 的 执行 过 程 是 ,在 栈 不 为 空 的 条 件 下 先 将 栈 顶 元 素 赋 给 e, 然 后 将 栈 顶 指针 减 1， 
并 返回 真 ; 否则 返回 假 。 算 法 如 下 : 


bool Pop(SqStack * &s,ElemType &-e) 


{ if(s—>top==—1) // 栈 为 空 的 情况 , 即 栈 下 溢出 
return false; 
e=s —> data[s —> top]; // 取 栈 顶 元 素 
本 // 栈 顶 指针 减 1 
return true; 


} 


6) 取 栈 项 元 素 GetTop(s ,&e) 
该 运算 在 栈 不 为 空 的 条 件 下 将 栈 顶 元 素 赋 给 e 并 返回 真 ; 否则 返回 假 。 算 法 如 下 : 


bool GetTop(SqStack * s,ElemType &e) 


{ if(s—>top==—1) // 栈 为 空 的 情况 , 即 栈 下 溢出 
return false; 
e=s—> data[s —> top] ; // 取 栈 顶 元 素 
return true; 


} 


和 出 栈 运 算 相 比 ,本 算法 只 是 没有 移动 栈 顶 指针 。 上 述 6 个 基本 运算 算法 的 时 间 复 杂 
度 均 为 0(1) ,说 明 这 是 一 种 非常 高 效 的 设计 。 

【 例 3.4】 设计 一 个 算法 利用 顺序 栈 判断 一 个 字符 串 是 否 为 对 称 串 。 所 谓 对 称 串 指 从 
左 向 右 读 和 从 右 向 左 读 的 序列 相同 。 扫 -- 扫 

国 ， 个 元 素 连续 进 栈 , 产 生 的 连续 出 栈 序列 和 输入 序列 正好 相反 ,本 | 国 






续 进 栈 ,如果 所 有 元 素 连续 出 栈 产 生 的 序列 和 str 从 头 到 尾 的 字符 依次 相 
同 ,表示 str 是 一 个 对 称 串 ,返回 真 ; 否则 表示 str 不 是 对 称 串 ,返回 假 。 算 。 祝 W 钱 
法 如 下 : 





bool symmetry( ElemType str[]) // 判 断 str 是 否 为 对 称 串 
{ int i; ElemType e; 
SqStack * st; // 定 义 顺序 栈 指针 
InitStack(st); // 初 始 化 栈 
for (i=0;str[] !="\0';i+++) // 将 str 的 所 有 元 素 进 栈 
Push(st, str[i] ); 
for (i=0;str[]!="\0';i+ 十 ) // 处 理 str 的 所 有 字符 
{ Pop(st,e); // 退 栈 元 素 e 
if (str[i] !=e) // 著 e 与 当前 串 字符 不 同 表示 不 是 对 称 串 
{ DestroyStack(st); // 销 毁 栈 
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return false; // 返 回 假 
} 
} 
DestroyStack(st); // 销 毁 栈 
return true; // 返 回 真 
} 


顺序 栈 采 用 一 个 数组 存放 栈 中 的 元 素 。 如 果 需 要 用 到 两 个 相同 类 型 的 栈 , 这 时 若 为 它 
们 各 自 开辟 一 个 数组 空间 , 极 有 可 能 出 现 这 样 的 情况 : 第 一 个 栈 已 满 ,再 进 栈 就 游 出 了 ,而 
另 一 个 栈 还 有 很 多 空闲 存储 空间 。 解 决 这 个 问题 的 方法 是 将 两 个 栈 合 起 来 ,如 图 3.6 所 示 ， 
用 一 个 数组 来 实现 这 两 个 栈 ,这 称 为 共享 栈 (share stack) 。 

















0 1 nl MaxSize—l 
数组 data: an] el | 
t t f 1 
1 1 1 
栈 1 的 栈 底 本 1 的 栈 项 本 2 的 栈 项 本 2 的 栈 底 
指针 topl 指针 top2 
栈 1 栈 2 

图 3.6 共享 栈 


在 设计 共享 栈 时 ,由 于 一 个 数组 (大 小 为 MaxSize) 有 两 个 端点 ,两 个 栈 有 两 个 栈 底 , 让 
一 个 栈 的 栈 底 为 数组 的 始 端 , 即 下 标 为 0 处 , 另 一 个 栈 的 栈 底 为 数组 的 末端 , 即 下 标 为 
MaxSize 一 1, 这 样 在 两 个 栈 中 进 栈 元 素 时 栈 项 向 中 间 伸 展 。 

共享 栈 的 4 个 要 素 如 下 。 


。 栈 空 条 件 : 栈 1 空 为 topl1==== 一 1; 栈 2 空 为 top2= 二 = MaxSize。 
。 栈 满 条 件 : topl 一 一 top2 一 1 。 


元 素 zx 进 栈 操作 : 进 栈 1 操作 为 topl 十 十 ;data[top1]= 二 x; 进 栈 2 操作 为 top2 一 一 ; 
data[ top2 |] 二 xz。 
出 栈 z 操作 : 出 栈 1 操作 为 + 二 data[Ltopl1];topl 一 一 ; 出 栈 2 操作 为 z= data[top2]; 
top2 十 十。 

在 上 述 设 置 中 ,data 数组 表示 共享 栈 的 存储 空间 ,topl 和 top2 分 别 为 两 个 栈 的 栈 顶 指 
针 , 这 样 该 共享 栈 通过 data、topl 和 top2 来 标识 ,也 可 以 将 它们 设计 为 一 个 结构 体 类 型 : 





typedef struct 
{ ElemType data[MaxSize] ; // 存 放 共享 栈 中 的 元 素 

int topl,top2; // 两 个 栈 的 栈 项 指针 lm 
} DStack; // 共 享 栈 的 类 型 


在 实现 共享 栈 的 基本 运算 算法 时 需要 增加 一 个 形 参 i, 指 出 是 对 哪个 栈 
进行 操作 ,如 i 二 1 表示 对 栈 1 进行 操作 ,i 二 2 表示 对 栈 2 进行 操作 。 


313 栈 的 链 式 存储 结构 及 其 基本 运算 的 实现 
栈 中 数据 元 素 的 好 辑 关系 旦 线性 关系 ,所 以 栈 可 以 像 线性 表 一 样 采用 
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链 式 存 储 结 构 。 采 用 链 式 存储 结构 的 栈 称 为 链 栈 (linked stack) 。 链 表 有 多 种 ,这 里 采用 带 
头 结 点 的 单 链 表 来 实现 链 栈 。 

链 栈 的 优点 是 不 存在 栈 满 上 溢出 的 情况 。 规 定 栈 的 所 有 操作 都 是 在 单 链表 的 表 头 进行 
的 (因为 给 定 链 栈 后 ,已 知 头 结 点 地 址 ,在 其 后 面 插入 一 个 新 结 点 和 删除 首 结 点 都 十 分 方便 ， 
对 应 算法 的 时 间 复 杂 度 均 为 0(1))。 

图 3.7 所 示 为 头 结 点 指针 为 * 的 链 栈 , 首 结 点 是 栈 顶 结 点 , 尾 结 点 是 栈 底 结 点 。 栈 中 元 
素 自 栈 底 到 栈 顶 依次 是 al ,az ,… ,a,。 





几 风 对 
”NA 多 结 点 术 厦 结 点 栈 底 结 点 
骂 [“ [ld [A 





图 3.7 栈 到 链 栈 的 映射 
链 栈 中 结 点 类 型 LinkStNode 的 声明 如 下 ; 


typedef struct linknode 


{ ElemType data; // 数 据 域 
struct linknode * next; // 指 针 域 
} LinkStNode; // 链 栈 结 点 类 型 


在 以 * 为 头 结 点 指针 的 链 栈 ( 简 称 链 栈 >) 中 ,可 以 归纳 出 对 后 面 算法 设计 来 说 非常 重要 
的 4 个 要 素 。 
栈 空 的 条 件 : s 一 > next 王 =NULL。 
栈 满 的 条 件 : 由 于 只 有 内 存 溢 出 时 才 出 现 栈 满 ,通常 不 考虑 这 样 的 情况 ,所 以 在 链 
栈 中 可 以 看 成 不 存在 栈 满 。 
。 元 素 。 的 进 栈 操作 : 新 建 一 个 结 点 存放 元 素 e( 由 p 指向 它 ), 将 结 点 p 插入 到 头 结 


点 之 后 。 
。 出 栈 操 作 : 取出 首 结 点 的 data 值 并 将 其 删除 。 
在 链 栈 上 对 应 栈 的 基本 运算 算法 设计 如 下 。 s 
1) 初始 化 栈 initStack(&s) 
该 运算 创建 一 个 空 链 栈 *, 如 图 3. 8 所 示 。 实 际 上 是 创建 链 栈 EA 
的 头 结 点 ,并 将 其 next 域 置 为 NULL。 算 法 如 下 : 症 和 人 


void InitStack(LinkStNode * &s) 

{ s=(LinkStNode * )malloc(sizeof(LinkStNode) ) ; 
s—> next=NULL:; 

} 


本 算法 的 时 间 复杂 度 为 0(1)。 


00, TITER 


2) 销毁 栈 DestroyStack(&s) 
该 运算 释放 链 栈 * 占用 的 全 部 结 点 空间 ,和 单 链 表 的 销毁 算法 完全 相同 。 算 法 如 下 : 


void DestroyStack(LinkStNode * &s) 


{ LinkStNode * pre=s, * p=s—> next; //pre 指向 头 结 点 ,p 指向 首 结 点 
while (p!=NULL) // 循 环 到 p 为 空 
{ free(pre); // 释 放 pre 结 点 
pre 一 pi; //Ppre\p 同步 后 移 


p 王 pre 一 > next; 
} 
free(pre); // 此 时 pre 指向 尾 结 点 ,释放 其 空间 
} 


本 算法 的 时 间 复 杂 度 为 0(n) ,其 中 为 链 栈 中 的 数据 结 点 个 数 。 
3) 判断 栈 是 否 为 空 StackEmpty(s) 
该 运算 判断 ;一 > next 二 NULL 的 条 件 是 否 成 立 。 算 法 如 下 : 


bool StackEmpty(LinkStNode * s) 
{ 
return(s —> next== NULL):; 


} 


本 算法 的 时 间 复 杂 度 为 O(1) 。 

4) 进 栈 PushC&s ,e) 

该 运算 新 建 一 个 结 点 ,用 于 存放 元 素 e( 由 户 指向 它 ), 然 后 将 其 插入 到 头 结 点 之 后 作为 
新 的 首 结 点 。 算 法 如 下 : 


void Push(LinkStNode * &s,ElemType e) 
{ LinkStNode * pi; 


p= (LinkStNode * )malloc(sizeof(LinkStNode) ) ; // 新 建 结 点 p 
p 一 > data=e; // 存 放 元 素 e 
p 一 next 一 s 一 > next; // 将 p 结 点 插入 作为 首 结 点 


s 一 > next 一 pi; 


} 


本 算法 的 时 间 复 杂 度 为 OC1) 。 

5) 出 栈 Pop(&s ,&e) 

该 运算 在 栈 不 为 空 的 条 件 下 提取 首 结 点 的 数据 域 赋 给 引用 型 参数 e, 然 后 将 其 删除 。 
算法 如 下 : 





bool Pop(LinkStNode * &s, ElemType &e) 
{ LinkStNode * p; 


if (s—> next==NULL) // 栈 空 的 情况 
return false; // 返 回 假 

p=s -> next; //p 指向 首 结 点 

e=p—> data; // 提 取 首 结 点 值 

S 一 > next 一 p 一 > next; // 删 除 首 结 点 
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free(p); // 释 放 被 删 结 点 的 存储 空间 
return true; // 返 回 真 

} 

本 算法 的 时 间 复 杂 度 为 OC1) 。 


6) 取 栈 顶 元 素 GetTop(s,&e) 
该 运算 在 栈 不 为 空 的 条 件 下 提取 首 结 点 的 数据 域 赋 给 引用 型 参数 e。 算 法 如 下 : 


bool GetTop( LinkStNode * s,ElemType &-e) 


{ if(s->next==NULL) // 栈 空 的 情况 
return false; // 返 回 假 
e 一 s 一 next 一 > data; // 提 取 首 结 点 值 
return true; // 返 回 真 


} 


和 出 栈 运算 相 比 ,本 算法 只 是 没有 改变 栈 顶 结 点 ,其 时 间 复 杂 度 为 O(1) 。 

【 例 3. 5】 设计 一 个 算法 判断 输入 的 表达 式 中 括号 是 否 配对 (假设 只 
含有 左右 圆 括号 ) 。 

该 算法 在 表达 式 括 号 配对 时 返回 真 ,否则 返回 假 。 设 置 一 个 链 栈 
st, 扫 描 表 达 式 exp, 遇 到 左 括号 时 进 栈 ; 遇 到 右 括 号 时 , 若 栈 顶 为 左 括号 ， 
则 出 栈 ,和 否则 返回 假 。 当 表达 式 扫 描 完 毕 而 且 栈 为 空 时 返回 真 ; 否则 返回 视频 讲解 
假 。 算 法 如 下 : 

















bool Match( char exp[] ,int n) 
{ inti=0; char e; 
bool match= true; 





LinkStNode * st; 
InitStack( st) ; // 初 始 化 链 栈 
while (i<n && match) // 扫 描 exp 中 的 所 有 字符 
人 二 exp 网 三 三 SO // 当 前 字符 为 左 括号 ,将 其 进 栈 
Push(st, exp[i] ); 
else if (exp[i] ==")') // 当 前 字符 为 右 括号 
{ 这 (GetTop(st,e) 二 二 true) ”// 成 功 取 栈 顶 元 素 e 
0 tet ry // 栈 顶 元 素 不 为 '(' 时 
match= false; // 表 示 不 匹配 
else // 栈 顶 元 素 为 '(' 时 
Pop(st, e); // 将 栈 顶 元 素 出 栈 
} 
else match 一 false; // 无 法 取 栈 顶 元 素 时 表示 不 匹配 
} 
| // 继 续 处 理 其 他 字符 
} 
if (!StackEmpty(st)) // 栈 不 空 时 表示 不 匹配 
match 一 false; 
DestroyStack(st) ; // 销 毁 栈 


return match; 
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314 栈 的 应 用 


在 实际 应 用 中 , 栈 通 常 作为 一 种 存放 临时 数据 的 容器 。 如 果 后 存 人 的 元 素 先 处 理 , 则 采 
用 栈 。 本 小 节 通 过 简单 表达 式 求 值 和 迷宫 问题 的 求解 过 程 来 说 明 栈 的 应 用 。 

1) 问题 描述 

这 里 限定 的 简单 表达 式 求 值 问题 是 用 户 输入 一 个 包含 十 \、 一 、* 、/\ 正 
整数 和 圆 括号 的 合法 算术 表达 式 ,计算 该 表达 式 的 运算 结果 。 本 

2) 数据 组 织 视频 讲解 

简单 表达 式 采用 字符 数组 exp 表示 ,其 中 只 含有 十 一、*、/ 正 整数 和 圆 括号 。 为 了 方 
便 , 假 设 该 表达 式 都 是 合法 的 算术 表达 式 ,例如 exp 二 "1 十 2* (4 十 12)", 在 设计 相关 算法 中 
用 到 栈 ,这 里 采用 顺序 栈 存储 结构 。 

3) 设计 运算 算法 

在 算术 表达 式 中 ,运算 符 位 于 两 个 操作 数 中 间 的 表达 式 称 为 中 缀 表达 式 (infix 
expression) ,例如 1 十 2* 3 就 是 一 个 中 缀 表达 式 。 中 缀 表达 式 是 一 种 最 常用 的 表达 式 形式 ， 
日 常生 活 中 的 表达 式 一 般 都 是 中 绥 表 达 式 。 

对 中 绥 表 达 式 的 运算 一 般 遵循 “ 先 乘 除 ,后 加 减 ,从 左 到 右 计 算 , 先 括号 内 ,后 括号 外 ”的 
规则 ,因此 中 绷 表 达 式 不 仅 要 依赖 运算 符 优 先 级 ,还 要 处 理 括 号 。 

算术 表达 式 的 另 一 种 形式 是 后 缀 表达 式 (postfix expression) 或 逆 波 兰 表 达 式 ,就 是 在 
算术 表达 式 中 运算 符 在 操作 数 的 后 面 ,如 1 十 2* 3 的 后 缀 表达 式 为 12 3 * 十 。 在 后 级 表 
达 式 中 已 经 考虑 了 运算 符 的 优先 级 ,没有 括号 ,只 有 操作 数 和 运算 符 ,而且 越 放 在 前 面 的 运 
算 符 越 优先 执行 。 

同样 ,在 算术 表达 式 中 ,如 果 运 算 符 在 操作 数 的 前 面 , 称 为 前 缀 表达 式 (prefix 
expression) ,如 1 十 2* 3 的 前 级 表达 式 为 十 1 * 2 3。 

后 级 表达 式 是 一 种 十 分 有 用 的 表达 式 , 它 将 复杂 表达 式 转换 为 可 以 依靠 简单 的 操作 得 
到 计算 结果 的 表达 式 。 所 以 对 中 绥 表 达 式 的 求 值 过 程 是 先 将 中 组 算术 表达 式 转换 成 后 绷 表 
达 式 ,然后 对 该 后 缀 表达 式 求 值 。 

(1) 将 算术 表达 式 转 换 成 后 级 表达 式 。 

在 将 一 个 中 缀 表达 式 转 换 成 后 缀 表达 式 时 ,操作 数 之 间 的 相对 次 序 是 不 变 的 ,但 运算 符 
的 相对 次 序 可 能 不 同 ,同时 还 要 除去 括号 。 所 以 在 转换 时 需要 从 左 到 右 扫 描 算 术 表 达 式 ,将 
遇 到 的 操作 数 直 接 存放 到 后 缀 表达 式 中 ,将 遇 到 的 每 一 个 运算 符 或 者 左 括号 都 暂时 保存 到 
a dba a 中 缀 表达 式 exp 后 组 表达 式 postexp 

假设 用 exp 字符 数组 存储 满足 前 面条 件 的 简单 1- >.3 
中 缀 表达 式 , 其 对 应 的 后 缀 表达 式 存 放 在 字符 数组 优先 级 比较 




















postexp 中 。 下 面 讨 论 几 种 情况 。 
例如 ,车 exp 二 "1 十 2 十 3" ,转换 过 程 是 首先 将 操 
作 数 1 存 人 postexp; 遇 到 第 1 个 ' 十 ', 尚 未 确定 它 是 运算 符 栈 


否 最 先 执行 ,将 其 进 栈 ; 再 将 操作 数 2 存 人 postexp; 3.9 两 个 ' 十 ' 进 行 优先 级 比较 





aa 
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又 遇 到 第 2 个 ' 十 ,需要 两 个 ' 十 ' 进 行 优先 级 比较 ,如 图 3. 9 所 示 ,如 果 直 接 将 第 2 个 ' 十 ' 进 
栈 , 它 以 后 一 定 先 出 栈 , 表 示 第 2 个 ' 十 ' 比 第 1 个 ' 十 ' 先 执行 ,显然 是 错误 的 。 正 确 的 做 法 是 
先 将 栈 中 的 第 1 个 ' 十 ' 出 栈 并 存 人 postexp, 然 后 再 将 第 2 个 ' 十 ' 进 栈 ( 表 示 第 1 个 ' 十 ' 先 执 
行 ); 最 后 将 操作 数 3 存 人 postexp; 此 时 exp 扫描 完毕 ,出 栈 第 2 个 ' 十 并存 人 postexp。 得 
到 的 最 后 结果 是 postexp 二 "1 2 十 3 十 "。 

归纳 1: 在 扫描 exp 遇 到 一 个 运算 符 op 时 ,如 果 栈 为 空 , 直 接 将 其 进 栈 ; 如 果 栈 不 空 ， 
只 有 当 op 的 优先 级 高 于 栈 顶 运算 符 的 优先 级 时 才 直 接 将 op 进 栈 ( 以 后 op 先 出 栈 表 示 先 执 
行 它 ); 否则 依次 出 栈 运算 符 并 存 入 postexp( 出 栈 的 运算 符 都 比 op 先 执行 ), 直 到 栈 顶 运算 
符 的 优先 级 小 于 op 的 优先 级 为 止 , 然 后 再 将 op 进 栈 。 





中 缀 表达 式 exp 后 级 表达 式 postexp 再 看 看 带 有 括号 的 例子 , 若 exp 二 "2 * (1 十 3) 
2*(1+3)-4 2 一 4", 转 换 过 程 是 将 操作 数 2 存 人 postexp; 遇 到 
人 "x ,将 其 进 栈 ， 遇 到 '(", 将 其 进 栈 ; 将 操作 数 1 存 和 

( postexp; 遇 到 ' 十 ' ,将 其 进 栈 ; 将 操作 数 3 存 入 

“ postexp; 遇 到 ')', 如 图 3. 10 所 示 ,出 栈 ' 十 ' 并 存 人 

运算 符 栈 postexp;, 出 栈 '('; 遇 到 ' 一 ", 出 栈 '* "并存 人 postexp， 

图 3.10 遇 到 ')' 的 情况 将 ' 一 ' 进 栈 ; 将 操作 数 4 存 和 人 postexp; 此 时 exp 扫 


描 完 毕 ,出 栈 ' 一 ' 并 存 入 postexp。 得 到 的 最 后 结果 

是 postexp 一 "2 13 十 * 4 一 "。 

归纳 2: 在 扫描 exp 遇 到 一 个 运算 符 op 时 ,如 果 op 为 "'", 表 示 一 个 子 表达 式 的 开始 , 直 
接 将 其 进 栈 ; 如 果 op 为 )', 表 示 一 个 子 表达 式 的 结束 ,需要 出 栈 运算 符 并 存 人 postexp, 直 
到 栈 顶 为 '(', 再 将 '(' 出 栈 ; 如 果 op 是 其 他 运算 符 ,而 栈 顶 为 "(', 直 接 将 其 进 栈 。 

设置 一 个 运算 符 栈 Optr, 初 始 时 为 空 。 为 了 方便 后 面 将 数值 串 转换 为 对 应 的 数值 ,在 
后 级 表达 式 中 的 每 个 数字 串 末 尾 添加 一 个 '#'。 将 算术 表达 式 exp 转换 成 后 缀 表达 式 
postexp 的 过 程 如 下 : 


while (从 exp 读 取 字 符 ch, ch!="\0') 
{ ”ch 为 数字 : 将 后 续 的 所 有 数字 均 依 次 存放 到 postexp 中 ,并 以 字符 '# ' 标 识 数字 串 结束 ; 
ch 为 左 括号 '(': 将 此 括号 进 栈 到 Optr 中 ; 
ch 为 右 括号 ')': 将 Optr 中 出 栈 时 遇 到 的 第 一 个 左 括号 '(' 以 前 的 运算 符 依次 出 栈 并 
存放 到 postexp 中 ,然后 将 左 括号 "(' 出 栈 ; 
ch 为 其 他 运算 符 : 
让 ( 栈 空 或 者 栈 顶 运算 符 为 '(') 直接 将 ch 进 栈 ; 
else if (ch 的 优先 级 高 于 栈 顶 运算 符 的 优先 级 ) 
直接 将 ch 进 栈 ; 
else 
依次 出 栈 并 存 人 到 postexp 中 ,直到 ch 的 优先 级 高 于 栈 顶 运算 符 ,然后 将 ch 进 栈 ; 
} 
车 exp 扫描 完毕 , 则 将 Optr 中 的 所 有 运算 符 依次 出 栈 并 存放 到 postexp 中 。 


对 于 简单 的 算术 表达 式 , ' 十 ' 和 ' 一 ' 运 算 符 的 优先 级 相同 ,'* ' 和 '/' 运 算 符 的 优先 级 相同 ， 
只 有 '* ' 和 '/' 运 算 符 的 优先 级 高 于 ' 十 ' 和 ' 一 ' 运 算 符 的 优先 级 。 所 以 上 述 过 程 进 一 步 改 为 如 
下 : 
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while (从 exp 读 取 字 符 ch, ch!= "\0') 
{ ”ch 为 数字 : 将 后 续 的 所 有 数字 均 依 次 存放 到 postexp 中 ,并 以 字符 '# "标识 数 字 串 结束 ; 
ch 为 左 括号 '(': 将 此 括号 进 栈 到 Optr 中 ; 
ch 为 右 括号 ')': 将 Optr 中 出 栈 时 遇 到 的 第 一 个 左 括号 '(' 以 前 的 运算 符 依次 出 栈 并 
存放 到 postexp 中 ,然后 将 左 括号 '(' 出 栈 ; 
ch 为 ' 十 ' 或 ' 一 ': 出 栈 运算 符 并 存放 到 postexp 中 ,直到 栈 空 或 者 栈 顶 为 '(', 然 后 将 ch 
进 栈 ; 
ch 为 '* 或/': 出 栈 运算 符 并 存放 到 postexp 中 ,直到 栈 空 或 者 栈 顶 为 '('、' 十 ' 或 ' 一 '， 
然后 将 ch 进 栈 ; 


} 
车 exp 扫描 完毕 , 则 将 Optr 中 的 所 有 运算 符 依次 出 栈 并 存放 到 postexp 中 。 


例如 对 于 表达 式 "(56 一 20)/(4 十 2)" ,其 转换 为 后 级 表达 式 的 过 程 如 表 3. 1 所 示 , 最 后 
得 到 的 后 缀 表达 式 为 "56 间 20 提 一 4 提 2 提 十 /"。 


表 3.1 表达 式 "(56 一 20)/(4 十 2)" 转 换 成 后 缀 表达 式 的 过 程 





Optr 栈 

0 2 (本 底 一 酚 顶 ) 
过 到 ch 为 '(', 将 此 括号 进 栈 ( 
遇 到 ch 为 数字 ,将 56# 存 人 postexp 中 56 井 ( 
过 到 ch 为 ' 一 ', 直 接 将 ch 进 栈 56 井 t= 
遇 到 ch 为 数字 ,将 20# 存 人 postexp 中 56#20# (= 
遇 到 ch 为)', 将 栈 中 '(' 之 前 的 运算 符 ' 一 ' 出 栈 并 存 人 postexp 56#20# 一 
中 ,然后 将 '(' 出 栈 
过 到 ch 为 /将 ch 进 栈 56 并 20# 一 上 
遇 到 ch 为 '(', 将 此 括号 进 栈 56 间 20 提 一 /A( 
遇 到 ch 为 数字 ,将 4# 存 人 postexp 中 56 提 20# 一 4## /Al 
遇 到 ch 为 ' 十 ', 由 于 栈 顶 运算 符 为 '(', 则 直接 将 ch 进 栈 56 提 20 提 一 4## A+ 
过 到 ch 为 数字 ,将 2# 存 人 postexp 中 56 间 20 提 一 4 林 2# 人 it 
遇 到 ch 为)', 将 栈 中 "(' 之 前 的 运算 符 ' 十 ' 出 栈 并 存 人 postexp 56 井 20 井 一 4 并 2 井 十 六 
中 ,然后 将 '(' 出 栈 


str 扫描 完毕 , 则 将 Optr 栈 中 的 所 有 运算 符 依次 出 栈 并 存 人 56#20# 一 4#2 间 十 / 
postexp 中 ,得 到 最 终 的 后 组 表达 式 





设置 运算 符 栈 类 型 SqStack 中 的 ElemType 为 char 类 型 。 根 据 上 述 原理 得 到 的 trans() 算 
法 如 下 : 





void trans(char * exp,char postexp 口 ) // 将 算术 表达 式 exp 转换 成 后 级 表达 式 postexp I 
{ chare; 

SqStack * Optr; // 定 义 运算 符 栈 指针 

InitStack( Optr) ; // 初 始 化 运算 符 栈 

int i=0; Wi 作为 postexp 的 下 标 

while (* exp!="\0') //exp 表达 式 未 扫描 完 时 循环 


{ switch( * exp) 
{ 
case '(': // 判 定 为 左 括号 


PE 了 O00 


Push(Optr, '('); 
exp 十 十 ; 
break; 
Chae )'s 
Pop(Optr, e); 
while (e!="(') 
{ ”postexp[i 十 十 ] 一 e; 
Pop(Optr, e); 
} 
exp 十 十 ; 
break; 
case ' 二 "3 
CH .把 St 
while (!StackEmpty(Optr)) 
{ GetTop(Optr,e); 
if (el="(') 
{ ”postexp[i 十 十 ] 一 e; 
Pop( Optr, e); 
} 
else 
break; 
} 
Push(Optr, * exp); 
exp 十 十 ; 
break; 
CaSe '%'": 
case /': 
while (!StackEmpty(Optr)) 
{ GetTop(Optr,e); 
if (e=="'#*' | e=="'/") 
{ ”postexp[i 十 十 ] 一 e; 
Pop( Optr, e); 
} 
else 
break; 
} 
Push(Optr, * exp); 
exp 十 十 ; 
break; 
default: 





postexp[i 十 十 ] = * exp; 
exp 十 十 ; 

} 

postexp[i 十 十 ] 二 ' 提 '; 

} 

} 
while (!StackEmpty(Optr)) 
{ Pop(Optr, e); 


while ( * exp>='0' && xexp<='9') 


EE l 


// 左 括号 进 栈 
// 继 续 扫 描 其 他 字符 


// 判 定 为 右 括号 

// 出 栈 元 素 e 

// 不 为 '(' 时 循环 

// 将 e 存 放 到 postexp 中 
// 继 续 出 栈 元 素 e 


// 继 续 扫 描 其 他 字符 
// 判 定 为 加 或 减 号 


// 栈 不 空 循 环 

// 取 栈 顶 元 素 e 

//e 不 是 '(' 

// 将 e 存 放 到 postexp 中 
// 出 栈 元 素 e 


//e 是 '(' 时 退出 循环 

// 将 ' 十 ' 或 ' 一 ' 进 栈 

// 继 续 扫描 其 他 字符 

// 判 定 为 '* ' 或 /' 号 

// 栈 不 空 循 环 

// 取 栈 顶 元 素 e 

// 将 栈 顶 '* ' 或 '/' 运 算 符 出 栈 并 存放 到 postexp 中 
// 将 e 存 放 到 postexp 中 

// 出 栈 元 素 e 

//e 为 非 '* ' 或 /' 运 算 符 时 退出 循环 
// 将 '* ' 或 /' 进 栈 

// 继 续 扫描 其 他 字符 


// 处 理 数字 字符 
// 判 定 为 数字 字符 


// 用 # 标 识 一 个 数字 串 结束 


// 此 时 exp 扫描 完毕 , 栈 不 空 时 循环 
// 出 栈 元 素 e 
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postexp[i 十 十 ] 一 e; // 将 e 存 放 到 postexp 中 
} 
postexp[] = "\0'; // 给 postexp 表达 式 添加 结束 标识 
DestroyStack( Optr) ; // 销 毁 栈 


} 


(2) 后 缀 表达 式 求 值 。 

后 缀 表达 式 的 求 值 过 程 是 从 左 到 右 扫 描 后 缀 表达 式 postexp, 若 读 取 的 是 一 个 操作 数 ， 
将 它 进 操作 数 栈 ,车 读 取 的 是 一 个 运算 符 op, 从 操作 数 栈 中 连续 出 栈 两 个 操作 数 , 假 设 为 
a( 第 1 个 出 栈 元 素 ) 和 46( 第 2 个 出 栈 元 素 ), 计 算 5 op a 的 值 ,并 将 计算 结果 进 操作 数 栈 。 
当 整 个 后 级 表达 式 扫描 结束 时 ,操作 数 栈 中 的 栈 顶 元 素 就 是 表达 式 的 计算 结果 。 

在 后 缀 表达 式 求 值 算法 设计 中 操作 数 栈 为 Opnd, 用 于 临时 存放 要 进行 某 种 算术 运算 
的 操作 数 。 下 面 给 出 后 级 表达 式 求 值 的 过 程 ,假设 postexp 存放 的 后 缀 表达 式 是 正确 的 ,在 
while 循环 结束 后 ,Opnd 栈 中 恰好 有 一 个 操作 数 , 它 就 是 该 后 缀 表达 式 的 求 值 结果 。 


while (从 postexp 读 取 字符 ch, ch!="\0') 
{ ch 为 ' 十 ': 从 Opnd 栈 中 出 栈 两 个 数值 a 和 b, 计 算 c=b 十 a; 将 c 进 栈 ; 
ch 为 ' 一 ': 从 Opnd 栈 中 出 栈 两 个 数值 a 和 b, 计 算 c=b 一 a; 将 c 进 栈 ; 
ch 为 '* ': 从 Opnd 栈 中 出 栈 两 个 数值 a 和 b, 计 算 c= 二 b* a; 将 c 进 栈 ; 
ch 为/': 从 Opnd 栈 中 出 栈 两 个 数值 a 和 b, 若 a 不 零 , 计 算 c=b/a; 将 c 进 栈 ; 
ch 为 数字 字符 : 将 连续 的 数字 串 转换 成 数值 d, 将 d 进 栈 ; 
} 
返回 Opnd 栈 的 栈 顶 操作 数 ( 即 后 级 表达 式 的 值 ); 


后 级 表达 式 "56#20# 一 4#2# 十 /" 的 求 值 过 程 如 表 3. 2 所 示 , 最 后 的 求 值 结果 为 6， 
与 原 表达 式 "(56 一 20)/(4 十 2)" 的 计算 结果 一 致 。 


表 3.2 后 缀 表达 式 "56 并 20# 一 4#2# 十 /" 的 求 值 过 程 





操 作 Opnd 栈 ( 栈 底 一 栈 顶 ) 

遇 到 56# ,将 56 进 栈 56 

遇 到 20# ,将 20 进 栈 56 ,20 

遇 到 ' 一 ', 出 栈 两 次 ,将 56 一 20=36 进 栈 36 

遇 到 4# ,将 4 进 栈 36,4 

遇 到 2# ,将 2 进 栈 36,4,2 

遇 到 ' 十 ', 出 栈 两 次 ,将 4 十 2 一 6 进 栈 36,6 

遇 到 '/', 出 栈 两 次 ,将 36/6 一 6 进 栈 6 


postexp 扫描 完毕 ,算法 结束 , 栈 项 数值 6 即 为 所 求 





设置 操作 数 栈 类 型 SqStackl 中 的 ElemType 为 double 类 型 ,将 栈 基 本 运算 名 称 后 面 加 
上 ”1? 以 区 别 前 面 字符 栈 的 基本 和 运算。 根据 上 述 计 算 原 理 得 到 求 后 缀 表达 式 值 的 算法 如 下 


double compvalue( char * postexp) // 计 算 后 缀 表达 式 的 值 
{double d,a,b,c,e; 
SqStackl * Opnd; // 定 义 操作 数 栈 
InitStack1(Opnd) ; // 初 始 化 操作 数 栈 
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while ( * postexp!= \0') 
{ switch (* postexp) 
{ 
cise +s 

Popl (Opnd, a); 

Popl (Opnd, b); 

c 一 b 十 ai; 

Pushl(Opnd,c); 

break; 

Cab "4 

Popl (Opnd, a); 

Popl (Opnd, b); 

b= a 

Pushl(Opnd, c); 

break; 

Case '¥# ": 

Popl (Opnd, a); 

Popl (Opnd, b); 

c=byas 

Pushl(Opnd, c); 

break; 

case /': 

Popl (Opnd, a); 

Popl (Opnd, b); 

if (a!l=0) 

{ c=b/a; 
Pushl(Opnd, ¢); 
break; 

) 


else 


//postexp 字符 串 未 扫描 完 时 循环 


// 判 定 为 ' 十 ' 号 
// 出 栈 元 素 a 
// 出 栈 元 素 b 

// 计 算 c 

// 将 计算 结果 c 进 栈 


// 判 定 为 ' 一 ' 号 
// 出 栈 元 素 a 
// 出 栈 元 素 b 

// 计 算 < 

// 将 计算 结果 c 进 栈 


// 判 定 为 "'* ' 号 

// 出 栈 元 素 a 
// 出 栈 元 素 b 

// 计 算 c 

// 将 计算 结果 c 进 栈 


// 判 定 为 /' 号 
// 出 栈 元 素 a 
// 出 栈 元 素 b 


// 计 算 c 
// 将 计算 结果 c 进 栈 


{ printf("\n\t 除 零 错误 !\n"); 


exit(0); 


while ( * postexp>='0' && * postexp<='9') 


// 异 常 退 出 


// 处 理 数字 字符 


// 将 连续 的 数字 字符 转换 成 对 应 的 数值 存放 到 d 中 
// 判 定 为 数字 字符 


{ d=10*d+t*postexp—'0'; 


postexp 十 十 ; 
} 
Pushl (Opnd, d); 
break; 
} 
postexp 十 十 ; 
} 
GetTopl(Opnd, e); 
DestroyStack1(Opnd) ; 
return e; 


} 


4) 设计 求解 程序 


设计 以 下 主 函 数 调用 上 述 算法 : 


// 将 数值 d 进 栈 


// 继 续 处 理 其 他 字符 


// 取 栈 顶 元 素 e 
// 销 毁 栈 
// 返 回 e 
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int main() 

{ charexp[]="(56—20)/(4+2)"; // 可 将 exp 改 为 键盘 输入 
char postexp[MaxSize] ; 
trans(exp,postexp); // 将 exp 转换 为 postexp 
printf(" 中 缀 表达 式 :%sN\n" ,exp); // 输 出 exp 
printf(" 后 缀 表达 式 : %s\n", postexp); // 输 出 postexp 
printf(" 表 达 式 的 值 : %g\n", compvalue( postexp)); // 求 postexp 的 值 并 输出 
return 1; 

} 

5) 运行 结果 


运行 本 程序 ,得 到 对 应 的 结果 如 下 : 


中 缀 表达 式 :(56 一 20)/(4 十 2) 
后 缀 表达 式 :56#20# 一 4 提 2# 十 / 
表达 式 的 值 :6 


1) 问题 描述 

给 定 一 个 MXN 的 迷宫 图 , 求 一 条 从 指定 入 口 到 出 口 的 迷宫 路 径 。 假 
设 一 个 迷宫 图 如 图 3. 11 所 示 ( 这 里 M==8, N= 二 8), 其 中 的 每 个 方块 用 空白 和 
表示 通道 ,用 阴影 表示 障碍 物 。 视频 讲解 

















一 般 情况 下 ,所 求 迷宫 路 径 是 简单 路 径 , 即 在 求 得 的 迷宫 路 径 上 不 会 重复 出 现 同 一 方 
块 。 一 个 迷宫 图 的 迷宫 路 径 可 能 有 多 条 ,这 些 迷 0123456789 
富 路 径 有 长 有 短 , 这 里 仅仅 考虑 用 栈 求 一 条 从 指 国 国 加 | 


入 口 
定 入 口 到 出 口 的 迷宫 路 径 。 


2) 数据 组 织 

为 了 表示 迷宫 ,设置 一 个 数组 mg, 其 中 每 
个 元 素 表示 一 个 方块 的 状态 ,为 0 时 表示 对 应 方 
块 是 通道 ,为 1 时 表示 对 应 方块 是 障碍 物 ( 不 可 
走 )。 为 了 算法 方便 ,一 般 在 迷宫 的 外 围 加 一 条 
围墙 。 图 3. 11 所 示 的 迷宫 对 应 的 迷宫 数组 mg 

















上 国 
oe 
加 | 国 加 加 

| | | | 
» 辆 回 画 画面 面 
(由 于 迷宫 四 周 加 了 一 条 围墙 , 故 mg 数组 的 行 图 3.11 一 个 迷宫 的 示意 图 
数 和 列 数 均 加 上 2) 如 下 : 





int mg[M+2] [N+2]= 

0 eh Uo 1 We Te Br Ul Eto 0 a Ro HS 
{L300 0.0:0, 20170:0:0:05 :10.051)s 
{1,0,1,1,1,0,0,0,0,1},{1,0,0,0,1,0,0,0,0,1}, 
{L0105000 1 O00 1. {0 Ll 0 1 LO Ly: 
{151,0,0,0,0,0,0,0, 21), {11,1,1,11,1,1,1,1 ); 


全 
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另外 ,在 算法 中 用 到 的 栈 采用 顺序 栈 存 储 结构 ,即将 迷宫 栈 声明 如 下 : 


typedef struct 


{ inti; // 当 前 方块 的 行 号 

int j; // 当 前 方块 的 列 号 

int di; //di 是 下 一 相 邻 可 走 方位 的 方位 号 
} Box; // 方 块 类 型 


typedef struct 
{ Box data[MaxSize] ; 
int top; // 栈 顶 指 针 
} StType; // 顺 序 栈 类 型 


3) 设计 运算 算法 

对 于 迷宫 中 的 每 个 方块 ,有 上 、 下 、 左 、 右 4 个 方块 相 邻 ,如 图 3. 12 所 示 , 第 i 行 第 j 列 
的 当前 方块 的 位 置 记 为 (i,j) ,规定 上 方 方 块 为 方位 0, 并 按 顺 时 针 方 向 递增 编号 。 在 试探 过 
程 中 ,假设 按 从 方位 0 到 方位 3 的 方向 查找 下 一 个 可 走 的 相 邻 方块 。 

求 迷宫 问题 就 是 在 一 个 指定 的 迷宫 中 求 出 从 入 口 到 出 口 的 一 条 路 径 。 在 求解 时 采用 
“ 穷 举 法 ”, 即 从 入 口 出 发 , 按 方 位 0 到 方位 3 的 次 序 试探 相 邻 的 方块 ,一 旦 找到 一 个 可 走 的 
相 邻 方块 就 继续 走 下 去 ,并 记 下 所 走 的 方位 ; 若 某 个 方块 没有 相 邻 的 可 走 方块 , 则 沿 原 路 退 
回 到 前 一 个 方块 , 换 下 一 个 方位 再 继续 试探 ,直到 所 有 可 能 的 通路 都 试探 完 为 止 。 

为 了 保证 在 任何 位 置 上 都 能 沿 原 路 退回 ( 称 为 回溯 ) ,需要 保存 从 入 口 到 当前 位 置 的 路 
径 上 走 过 的 方块 ,由 于 回溯 的 过 程 是 从 当前 位 置 退 回 到 前 一 个 方块 ,体现 出 后 进 先 出 的 特 
点 ,所 以 采用 栈 来 保存 走 过 的 方块 。 

车 一 个 非 出 口 方块 (i, 站 是 可 走 的 ,将 它 进 栈 ,每 个 刚刚 进 栈 的 方块 ,其 方位 d; 置 为 一 1 
(表示 尚未 试探 它 的 周围 ) ,然后 开始 从 方位 0 到 方位 3 试探 这 个 栈 顶 方块 的 四 周 ,如 果 找 到 
某 个 方位 d 的 相 邻 方块 (i ,ji) 是 可 走 的 , 则 将 栈 顶 方块 (i,j) 的 方位 di 置 为 & ,同时 将 方块 
Ca, 广 ) 进 栈 , 再 继续 从 方块 Ga ,ji ) 做 相同 的 操作 。 若 方块 (i, 丫 的 四 周 没有 一 个 方位 是 可 走 
的 ,将 它 退 栈 ,如 图 3. 13 所 示 ,前 一 个 方块 (z,y) 变 成 栈 顶 方块 ,再 从 方块 (z,y) 的 下 一 个 方 
位 继续 试探 。 

















1 方位 0 前 一 个 方块 当前 方块 每 洲 
(方位 0 GD | 坟 好 和 
。 : ii] 
方位 3 ,方位 1 续 
CFD DT GD) 搓 
be 这 他 
、 Rt 路 
(it1, 放 方位 2 径 
3.12 迷宫 方位 图 3.13 方块 (i,j) 的 四 周 没有 一 个 方位 可 走 的 情况 


在 算法 中 应 保证 试探 的 相 邻 可 走 方块 不 是 已 走路 径 上 的 方块 。 如 方块 (i, 站 已 进 栈 ,在 
试探 方块 (i 十 1, 站 的 相 邻 可 走 方块 时 又 会 试探 到 方块 (i,j)。 也 就 是 说 ,从 方块 (i,j 出 发 会 
试探 方块 (i 十 1, 站 ,而 从 方块 (i 十 1, 站 出 发 又 会 试探 方块 (i,j) ,这样 可 能 会 引起 死 循环 ,为 


AS 人 本 和 队列 | 


此 在 一 个 方块 进 栈 后 将 对 应 的 mg 数组 元 素 值 改 为 一 1( 变 为 不 可 走 的 相 邻 方块 ), 当 退 栈 时 


(表示 该 栈 顶 方块 没有 可 走 相 邻 方块 ) 将 其 恢复 为 0。 
求解 迷宫 中 从 入 口 (xi,yi) 到 出 口 (xe,ye) 的 一 条 迷宫 路 径 的 过 程 如 下 : 


将 人 口 (xi,yD 进 栈 ( 其 初始 方位 设置 为 一 1); 
mg[xi] [yi]=—1; 
while ( 栈 不 空 ) 
{ ” 取 栈 顶 方块 (i,j, di); 
计 ((i,j) 是 出 口 (xe,ye)) 
{ ”输出 栈 中 的 全 部 方块 构成 一 条 迷宫 路 径 ; 
return true; 
} 
查找 (i,j,di) 的 下 一 个 相 邻 可 走 方块 ; 
过 (找到 一 个 相 邻 可 走 方块 ) 
{ 该 方块 为 (jl), 对 应 方位 d; 
将 栈 顶 方块 的 di 设置 为 d; 
(il ,j, 一 1) 进 栈 ; 
mg[il] G1 =—1; 
} 
if (没有 找到 (i,j, di) 的 任何 相 邻 可 走 方块 ) 
{ 将 (ij,dD 出 栈 ; 
mg[i] 0]=0; 
} 
} 
return false; // 没 有 找到 迷宫 路 径 


根据 上 述 过 程 得 到 求 迷宫 问题 的 算法 如 下 : 
bool mgpath(int xi, int yi, int xe,int ye) // 求 解 路 径 为 (xi, yD 一 >(xe,ye) 


{ Boxpath[MaxSize], e; 
int i,j,di,i1 ,j,k; 


bool find; 
StType * st; // 定 义 栈 st 
InitStack(st); // 初 始 化 栈 顶 指针 
e.i=xi; e.j=yi; e.di=—1; // 设 置 e 为 人 口 
Push( st, e); // 方 块 e 进 栈 
mg[xi] [yi] =—1; // 将 入 口 的 迷宫 值 置 为 一 1, 避免 重复 走 到 该 方块 
while (!StackEmpty(st)) // 栈 不 空 时 循环 
{ GetTop(st,e); // 取 栈 顶 方块 e 
i=e.i; j=e.j; di 一 e.di; 
if (i==xe && j==ye) // 找 到 了 出 口 ,输出 该 路 径 
{ printf(" 一 条 迷宫 路 径 如 下 :\n"); 
k=05 
while (!StackEmpty(st)) 
{ Pop(st,e); // 出 栈 方块 e 
path[k 十 十 ] 一 e; // 将 e 添 加 到 path 数组 中 
} 
while (k>=1) 
a 





PE 了 OO 


printf("\t(%d, %d)", path[k] .i,path[k] .j); 
if ((k+2)%5==0) // 每 输出 5 个 方块 后 换 一 行 
printf("\n"); 
} 
printf("\n"); 
DestroyStack( st) ; // 销 毁 栈 
return true; // 输 出 一 条 迷宫 路 径 后 返回 true 
} 
find= false; 
while (di<4 &&. lfind) // 找 方块 (i,j) 的 下 一 个 相 邻 可 走 方块 (i1,j1) 
di 
switch(di) 


i—1; jl=j; break; 
=j+1; break; 
十 1; j1=j; break; 
case 3:il=i; jl=j—1; break; 







} 
并 (mg[il]01]==0) find==true; // 找 到 一 个 相 邻 可 走 方块 ,设置 find 为 真 
} 


if (find) // 找 到 了 一 个 相 邻 可 走 方块 (i1,j1) 
{ st—>data[st—> top].di=di; // 修 改 原 栈 顶 元 素 的 di 值 
e.i=il; e.j=jl; e.di=—1; 
Push(st, e); // 相 邻 可 走 方 块 e 进 栈 
mg[il] G1]=—1; // 将 (il,jl) 迷 宫 值 置 为 一 1 ,避免 重复 走 到 该 方块 
} 
else // 没 有 路 径 可 走 , 则 退 栈 
{ Pop(st,e); // 将 栈 顶 方块 退 栈 
mg[e.i [e.j] =0; // 让 退 栈 方块 的 位 置 变 为 其 他 路 径 可 走 方块 
} 
1 
DestroyStack(st) ; // 销 毁 栈 
return false; // 表 示 没 有 可 走路 径 , 返 回 false 


} 

4) 设计 求解 程序 
建立 以 下 主 函 数 调用 上 述 算法 : 
int main() 


{ if(!mgpath(1,1,M,N)) 
printf(" 该 迷宫 问题 没有 解 !"); 





ER return 1; 


} 


5) 运行 结果 
对 于 图 3. 11 所 示 的 迷宫 ,从 入 口 (1,1) 到 出 口 (8,8) 的 求解 结果 如 下 : 


一 条 迷 官 路 径 如 下 : 
(1,1) (1,2) (2,2) (3,2) (3,1) 


(4,1) 
(6,4) 
(4,7) 
(6,8) 


上 述 迷 宫 路 径 的 显示 结果 如 图 3. 14 所 示 , 图 
中 路 径 上 方块 (i,j) 中 的 箭头 表示 从 该 方块 行走 
到 下 一 个 相 邻 方块 的 方位 ,例如 方块 (1,1) 中 的 箭 
头 是 “一 ”, 该 箭头 表示 方位 1, 即 方块 (1,1) 走 方 
位 1 到 相 邻 方块 (1 ,2)。 显 然 这 个 解 不 是 最 优 解 ， 
即 不 是 最 短路 径 , 在 使 用 队列 求解 时 可 以 找 出 最 
短路 径 ,这 将 在 后 面 介绍 。 

实际 上 ,在 使 用 栈 求 解 迷宫 问题 时 , 当 找 到 出 
口 后 输出 一 个 迷宫 路 径 , 然 后 可 以 继续 回溯 搜索 


下 一 条 迷 官 路 径 。 采 用 这 种 回溯 方法 可 以 找 出 所 。。 图 3 14 用 本 求解 的 迷宫 路 和 
有 的 迷宫 路 径 。 


队列 也 有 广泛 的 应 用 ,特别 是 在 操作 系统 的 资源 分 配 和 排队 论 中 大 量 | - 昌 
地 使 用 了 队列 。 本 节 主 要 讨论 队列 及 其 应 用 。 本 
321 队列 的 定义 


队列 (queue) 简 称 队 , 它 也 是 一 种 操作 受 限 的 线性 表 , 其 限制 为 仅 允 许 训 
在 表 的 一 端 进 行 插 入 操作 ,而 在 表 的 另 一 端 进行 删除 
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操作 。 把 进行 插入 的 一 端 称 为 队 尾 
(rear) ,把 进行 删除 的 一 端 称 为 队 头 或 队 首 (front) ,如 图 3. 15 所 示 。 
向 队列 中 插入 新 元 素 称 为 进 队 或 入 队 (enqueue) ,新 元 素 进 队 后 就 成 
为 新 的 队 尾 元 素 ; 从 队列 中 删除 元 素 称 为 出 队 或 离队 (dequeue) ,元 
素 出 队 后 ,其 直接 后 继 元 素 就 成 为 队 首 元 素 。 

由 于 队列 的 插入 和 删除 操作 分 别 是 在 各 自 的 一 端 进行 的 ,每 个 
元 素 必 然 按 照 进 入 的 次 序 出 队 , 所 以 又 把 队列 称 为 先进 先 出 表 (First 
In First Out,FIFO) 。 

例如 ,若干 个 人 走 过 一 个 独木桥 ,下 桥 的 顺序 和 上 桥 的 顺序 相 
同 ,在 这 里 该 独木桥 就 是 一 个 队列 。 





队列 抽象 数据 类 型 的 定义 如 下 : 


ADT Queue 


{ ”数据 对 象 : 
D={ a;|1<i<n,n 之 0,ai 为 ElemType 类 型 } //ElemType 是 自 定义 类 型 标识 符 
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数据 关系 : 
R={<ai,ain> | ai,aim ED,i=1, -…,n—1} 

基本 运算 : 
InitQueue( &q) : 初始 化 队列 ,构造 一 个 空 队列 g。 
DestroyQueue(& 9) : 销毁 队列 ,释放 队列 g 占用 的 存储 空间 。 
QueueEmpty(g): 判断 队列 是 否 为 空 , 若 队列 g 为 空 , 则 返回 真 ; 否则 返回 假 。 
enQueue( &gq,e): 进 队 列 ,将 元 素 e 进 队 作为 队 尾 元 素 。 
deQueue(&g, 了 &e): 出 队列 ,从 队列 g 中 出 队 一 个 元 素 , 并 将 其 值 赋 给 e。 

} 


【 例 3.6】 车 元 素 的 进 队 顺序 为 1234, 能 否 得 到 3142 的 出 队 顺 序 ? 
若 进 队 顺序 为 1234, 不 同 于 栈 ,出 队 的 顺序 只 有 一 种 , 即 1234( 先 进 先 出 ), 所 以 不 
能 得 到 3142 的 出 队 顺 序 。 扫 -- 扫 
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队列 中 数据 元 素 的 逻辑 关系 呈 线 性 关系 ,所 以 队列 可 以 像 线 性 表 一 样 
采用 顺序 存储 结构 进行 存储 , 即 分 配 一 块 连续 的 存储 空间 来 存放 队列 中 的 
元 素 , 并 用 两 个 整 型 变量 来 反映 队列 中 元 素 的 变化 ,它们 分 别 存储 队 首 元 素 
和 队 尾 元 素 的 下 标 位 置 ,分 别称 为 队 首 指针 ( 队 头 指针 ) 和 队 尾 指针 。 和 采用 顺序 存储 结构 的 
队列 称 为 顺序 队 (sequential queue) 。 

假设 队列 中 元 素 个 数 最 多 不 超过 整数 MaxSize, 所 有 的 元 素 都 具有 ElemType 数据 类 
型 , 则 顺序 队 类 型 SqgQueue 声明 如 下 : 

















typedef struct 


{ ElemType data[MaxSize] ; // 存 放 队 中 元 素 
int front, rear; // 队 头 和 队 尾 指针 
} SqQueue; // 顺 序 队 类 型 


队列 到 顺序 队 的 映射 过 程 如 图 3. 16 所 示 ,并且 约定 在 顺序 队 中 队 头 指针 front 指向 当 
前 队列 中 队 头 元 素 的 前 一 个 位 置 , 队 尾 指针 rear 指向 当前 队列 中 队 尾 元 素 的 位 置 。 本 节 采 
用 队列 指针 gq 的 方式 建立 和 使 用 顺序 队 。 








顺序 队 
队列 直接 映射 0 MaxSize-l 
(al aa an ya) 二 一 > . a | | | | a | eg f 7 
< 7 





















































data front rear 


图 3.16 队列 到 顺序 队 的 映射 





T“ 顺 序 忆 审 实 现 队列 的 基 术 运算 

图 3. 17 所 示 为 一 个 顺序 队 操 作 过 程 的 示意 图 ,其 中 MaxSize 一 5。 初 始 时 front 一 
rear 一 一 1。 图 3.17(a) 表 示 一 个 空 队 ; 图 3.17(b) 表 示 进 队 5 个 元 素 后 的 状态 ; 图 3. 17(c) 
表示 出 队 两 个 元 素 后 的 状态 ; 图 3. 17(d) 表 示 再 出 队 3 个 元 素 后 的 状态 。 

从 图 中 可 以 看 到 , 队 空 的 条 件 为 front 二 rear( 图 3.17(a) 和 图 3.17(d) 都 是 这 种 情况 ); 
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元 素 进 队 时 队 尾 指针 rear 总 是 增 1, 所 以 队 满 条 件 是 rear 指向 最 大 下 标 , 即 rear 一 一 
MaxSize 一 1( 图 3.17(b) 和 图 3. 17(c) 都 是 这 种 情况 ) 。 
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3.17 队列 操作 过 程 的 示意 图 


综 上 所 述 , 对 于 g 所 指 的 顺序 队 ( 即 顺序 队 gq) ,初始 时 设置 g 一 > rear 一 g 一 > front 一 
一 1, 可 以 归纳 出 对 后 面 算法 设计 来 说 非常 重要 的 4 个 要 素 。 

。 队 空 的 条 件 : g 一 > front 王 一 q 一 > rear。 

。 队 满 的 条 件 : g 一 > rear 二 二 MaxSize 一 1(data 数组 的 最 大 下 标 )。 

。 元素 。 的 进 队 操作 : 先 将 rear 增 1, 然 后 将 元 素 e 放 在 data 数组 的 rear 位 置 。 

。 出 队 操作 : 先 将 front 增 1, 然 后 取出 data 数组 中 front 位 置 的 元 素 。 

在 顺序 队 上 对 应 队列 的 基本 运算 算法 设计 如 下 。 

1) 初始 化 队列 InitQueue(&q) 

构造 一 个 空 队列 g, 将 front 和 rear 指针 均 设 置 成 初始 状态 , 即 一 1 值 。 算 法 如 下 : 


void InitQueue(SqQueue * &q) 
{ gq=(SqQueue * )malloc(sizeof(SqQueue) ) ; 
q 一 > front 一 q 一 > rear 一 一 1; 


} 


2) 销毁 队列 DestroyQueue(&q) 
释放 队列 g 占用 的 存储 空间 。 算 法 如 下 : 
void DestroyQueue( SqQueue * &-q) 


{ 
free(q); 





3) 判断 队列 是 否 为 空 QueueEmpty(q) 


若 队列 4 为 空 ,返回 真 ; 否则 返回 假 。 算 法 如 下 : aa 


bool QueueEmpty(SqQueue * q) 
{ 
return(q 一 > front 一 一 q 一 > rear); 


} 


4) 进 队 列 enQueue(&q,e) 
在 队列 g 不 满 的 条 件 下 先 将 队 尾 指针 rear 增 1. 然 后 将 元 素 e 插 和 到 该 位 置 。 算 法 如 下 ， 
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bool enQueue(SqQueue * &q,ElemType e) 


{ if(q->rear==MaxSize—1) // 队 满 上 溢出 
return false; // 返 回 假 
q—> rear 十 十 ; // 队 尾 增 1 
q—> data[q 一 > rear] =e; //rear 位 置 插入 元 素 e 
return true; // 返 回 真 


} 


5) 出 队列 deOueue(&q ,&e) 
在 队列 g 不 空 的 条 件 下 先 将 队 头 指针 front 增 1, 并 将 该 位 置 的 元 素 值 赋 给 ec。 算法 
如 下 : 


bool deQueue(SqQueue * &q,ElemType &-e) 
{ if(q—>front==q—> rear) // 队 空 下 溢出 
return false; 
q 一 > front 十 十 ; 
e 一 q 一 data[q —> front] ; 
return true; 


} 


上 述 5 个 基本 运算 算法 的 时 间 复杂 度 均 为 (1)。 全 汪 
CR A SS ME Sp 





在 前 面 的 顺序 队 操 作 中 ,元 素 进 队 时 队 尾 指针 rear 增 1, 元 素 出 队 时 队 
头 指 针 front 增 1, 当 队 满 的 条 件 ( 即 rear 二 二 MaxSize 一 1) 成 立时 ,表示 此 时 
队 满 (上 溢出 ) 了 ,不 能 再 进 队 元 素 。 实 际 上 , 当 rear 王 二 MaxSize 一 1 成 立 人 全 本 
时 ,队列 中 可 能 还 有 空位 置 ,这 种 因为 队 满 条 件 设置 不 合理 导致 队 满 条 件 成 立 而 队列 中 仍然 
有 空位 置 的 情况 称 为 假 溢 出 (false overflow) ,图 3. 17(c) 所 示 就 是 假 溢出 的 情况 。 

可 以 看 出 ,在 出 现 假 溢出 时 队 尾 指 针 rear 指向 data 数组 的 最 大 下 标 , 而 另外 一 端 还 有 
若干 个 空位 置 。 解 决 的 方法 是 把 data 数组 的 前 端 和 后 端 连接 起 来 ,形成 一 个 环形 数组 , 即 
把 存储 队列 元 素 的 数组 从 逮 辑 上 看 成 一 个 环 , 称 为 环形 队列 或 者 循环 队列 (circular queue) 。 

环形 队列 首尾 相连 后 , 当 队 尾 指针 rear 王 MaxSize 一 1 后 ,再 前 进 一 个 位 置 就 到 达 0 ,于 
是 就 可 以 使 用 另 一 端的 空位 置 存放 队列 元 素 了 。 实 际 上 存储 器 中 的 地 址 总 是 连续 编号 的 ， 
为 此 采用 数学 上 的 求 余 运算 (%) 来 实现 : 








队 头 指针 front 循环 增 1: front= (front 十 1) % MaxSize 
队 尾 指针 rear 循环 增 1: rear 一 (rear 十 1) %MaxSize 


环形 队列 的 队 头 指针 front 和 队 尾 指针 rear 初始 化 时 都 置 为 0, 即 front 二 rear 二 0。 在 
进 队 元 素 和 出 队 元 素 时 , 队 尾 指 针 和 队 头 指针 分 别 循环 增 1 。 

那么 ,环形 队列 g 的 队 满 和 队 空 条 件 如 何 设置 呢 ? 显然 队 空 条 件 是 g 一 > rear 一 一 q 一 > 
front。 当 进 队 元 素 的 速度 快 于 出 队 元 素 的 速度 时 , 队 尾 指针 会 回 过 来 很 快 赶 上 队 首 指针 ， 
此 时 可 以 看 出 环形 队列 的 队 满 条 件 也 是 g 一 > rear 二 二 g 一 > front, 也 就 是 说 无 法 仅 通过 这 两 
个 指针 的 当前 位 置 区 分 开 队 空 和 队 满 。 
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那么 怎样 区 分 队 空 和 队 满 呢 ? 改 为 以 * 队 尾 指针 循环 增 1 时 等 于 队 头 指针 ”作为 队 满 条 
件 ,也 就 是 说 尝试 进 队 一 次 , 若 达到 队 头 , 就 认为 队 满 了 ,不 能 再 进 队 。 这 样 环形 队列 少 用 一 
个 元 素 空间 , 即 该 队列 中 在 任何 时 刻 最 多 只 能 有 MaxSize 一 1 个 元 素 。 

因此 ,在 环形 队列 g 中 设置 队 空 条 件 是 g 一 > rear 二 二 g 一 > front; 队 满 条 件 是 (g 一 > 
rear 十 1) % MaxSize 二 二 g 一 > front。 而 进 队 操作 和 出 队 操 作 改 为 分 别 将 队 尾 rear 和 队 头 
指针 front 循环 进 1 。 

图 3. 18 说 明了 环形 队列 操作 的 几 种 状态 ,这 里 假设 MaxSize 等 于 5。 
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图 3.18 环形 队列 操作 示意 图 


在 这 样 设计 的 环形 队列 中 ,实现 队列 的 基本 运算 算法 如 下 。 
1) 初始 化 队列 InitQueue(&q) 
构造 一 个 空 队列 g, 将 front 和 rear 指针 均 设 置 成 初始 状态 , 即 0 值 。 算 法 如 下 : 


void InitQueue(SqQueue * &-q) 
{ q=(SqQueue * )malloc (sizeof(SqQueue) ) ; 
q—> front=q 一 rear=0; 


} 


2) 销毁 队列 DestroyQueue(&q) 





释放 队列 g 占用 的 存储 空间 。 算 法 如 下 : Do 


void DestroyQueue(SqQueue * &q) 
{ 

free(q); 
} 


3) 判断 队列 是 否 为 空 QueueEmpty(9) 
若 队列 为 空 返回 真 ; 否则 返回 假 。 算 法 如 下 : 
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bool QueueEmpty(SqQueue * q) 
{ 
return(q 一 > front 一 一 q 一 > rear); 


} 


4) 进 队 列 enQueue(&q.e) 
在 队列 不 满 的 条 件 下 先 将 队 尾 指针 rear 循环 增 1, 然 后 将 元 素 插入 到 该 位 置 。 算 法 
如 下 : 


bool enQueue(SqQueue * &q,ElemType e) 
{ if((q—> reari+1)%MaxSize==q—>front) // 队 满 上 溢出 
return false; 
q—> rear 一 (q 一 > rear 十 1) % MaxSize; 
q—> data[q —> rear] =e; 
return true; 


} 


5) 出 队列 deQueue(&q ,&e) 
在 队列 g 不 空 的 条 件 下 将 队 首 指针 front 循环 增 1, 取 出 该 位 置 的 元 素 并 赋 给 e。 算 法 
如 下 : 


bool deQueue(SqQueue * &q,ElemType &-e) 
{ if(q->front==q—> rear) // 队 空 下 溢出 
return false; 
q—> front 一 (q 一 > front 十 1) % MaxSize; 
e=q—> data[q 一 > front] ; 
return true; 


} 


同样 ,上 述 5 个 基本 运算 算法 的 时 间 复 杂 度 均 为 O(1) 。 

说 明 : 在 环形 队列 中 , 队 头 指针 front 指向 队 中 队 头 元 素 的 前 一 个 位 置 , 队 尾 指针 rear 
指向 队 中 的 队 尾 元 素 , 队 列 中 的 元 素 个 数 二 (rear 一 front 十 MaxSize) %MaxSize。 

需要 说 明 的 是 ,环形 队列 解决 了 假 溢 出 现象 ,更 充分 地 利用 了 队列 空间 。 那 么 是 不 是 在 
任何 情况 下 都 采用 环形 队列 呢 ? 答案 是 否定 的 。 在 环形 队列 中 , 随 着 多 次 元 素 的 进 队 和 出 
队 ,出 队 元 素 的 空间 可 能 被 新 进 队 的 元 素 覆 盖 。 在 有 些 情 况 下 ,需要 利用 出 队 的 元 素来 求解 
(从 data 数组 角度 看 ,只 要 未 被 覆盖 ,出 队 的 元 素 仍 在 其 中 ) ,例如 用 队列 求解 迷宫 问题 就 属 
于 这 种 情况 ,所 以 采用 环形 队列 还 是 非 环形 队列 根据 实际 求解 问题 来 确定 。 

【 例 3.7】 对 于 环形 队列 来 说 ,如 果 知 道 队 头 指针 和 队列 中 的 元 素 个 数 , 则 可 以 计算 出 
队 尾 指针 。 也 就 是 说 ,可 以 用 队列 中 的 元 素 个 数 代 蔡 队 尾 指 针 。 设 计 出 这 种 环形 队列 的 初 
始 化 、 进 队 、 出 队 和 判 队 空 算法 。 

依 题 意 设计 的 环形 队列 类 型 如 下 。 


typedef struct 
{ ElemType data[MaxSize] ; 
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int front; // 队 头 指针 
int count; // 队 列 中 的 元 素 个 数 
} QuType; // 本 例 的 环形 队列 类 型 


当 已 知 队 列 的 队 头 指针 front 和 队列 中 的 元 素 个 数 count 后 , 队 尾 指针 
rear 的 计算 公式 是 rear 二 (front 十 count)%MaxSize。 因 此 ,这 种 队列 的 队 空 
条 件 为 count 二 二 0; 队 满 条 件 为 count 二 二 MaxSize; 元 素 。 的 进 队 操作 是 先 
根据 队 头 指针 和 元 素 个 数 求 出 队 尾 指针 rear, 将 rear 循环 增 1, 然 后 将 元 素 。 | 疝 
放置 在 rear 处 ; 出 队 操作 是 先 将 队 头 指针 循环 增 1, 然 后 取出 该 位 置 的 元 素 。 视频 讲解 








对 应 的 算法 如 下 : 


void InitQueue(QuType * &qu) // 初 始 化 算法 
{ qu= (QuType * )malloc(sizeof(QuType)); 
qu 一 > front 一 0; // 队 头 指针 设置 为 0 
qu—> count 一 0; // 队 列 中 的 元 素 个 数 设置 为 0 
} 
bool EnQueue(QuType * &qu, ElemType x) // 进 队 算法 
{ intrear; // 临 时 存放 队 尾 指针 
if (qu 一 > count== MaxSize) // 队 满 上 溢出 
return false; 
else 
{ rear=(qu—> front 十 qu 一 > count) % MaxSize; // 求 队 尾 位 置 


rear 一 (rear 十 1) % MaxSize; 
qu -> data[rear] =x; 


// 队 尾 指针 循环 增 1 


qu 一 > count 十 十 ; // 元 素 个 数 增 1 
return true; 
} 
} 
bool DeQueue(QuType * & qu,ElemType &x) // 出 队 算法 
{ if(qu->count==0) // 队 空 下 溢出 
return false; 
else 
{ qu—>front= (qu—> front+1)%MaxSize; // 队 头 循环 增 1 
x=qu—> data[qu 一 > front] ; 
qu -> count 一 一 ; // 元 素 个 数 减 1 
return true; 
} 
} 
bool QueueEmpty(QuType * qu) // 判 队 空 算法 


{ 
return(qu 一 > count==0); 


} 


注意 : 采用 本 例 设计 的 环形 队列 中 最 多 可 以 放置 MaxSize 个 元 素 。 
323 队列 的 链 式 存储 结构 及 其 基本 运算 的 实现 


队列 中 数据 元 素 的 逻辑 关系 呈 线 性 关系 ,所 以 队列 可 以 像 线性 表 一 样 采 9 
用 链 式 存储 结构 。 采 用 链 式 存储 结构 的 队列 称 为 链 队 (linked queue)。 链 表 视频 讲解 


103 








数据 结构 教程 \ 目 DOG 





有 多 种 ,这 里 是 采用 单 链 表 来 实现 链 队 的 。 

在 这 样 的 链 队 中 只 允许 在 单 链表 的 表 头 进行 删除 操作 (出 队 ) 和 在 单 链表 的 表 尾 进 行 插 
入 操作 ( 进 队 ), 因 此 需要 使 用 队 头 指针 front 和 队 尾 指针 rear 两 个 指针 ,用 front 指向 队 首 
结 点 ,用 rear 指向 队 尾 结 点 。 和 链 栈 一 样 , 链 队 中 也 不 存在 队 满 上 溢出 的 情况 。 

链 队 存储 结构 如 图 3. 19 所 示 。 链 队 中 数据 结 点 的 类 型 DataNode 声明 如 下 : 


typedef struct qnode 




















{ ElemType data; // 存 放 元 素 
struct qnode * next; // 下 一 个 结 点 指针 

} DataNode; // 链 队 数 据 结 点 的 类 型 

队列 

(al aa an) 
ms 
队 首 结 点 队 尾 结 点 
En es ey es 
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图 3. 19 链 队 存储 结构 
链 队 头 结 点 (或 链 队 结 点 ) 的 类 型 LinkQuNode 声明 如 下 : 


typedef struct 


{ DataNode * front; // 指 向 队 首 结 点 
DataNode * rear; // 指 向 队 尾 结 点 
} LinkQuNode; // 链 队 结 点 的 类 型 


图 3. 20 说 明了 一 个 链 队 g 的 动态 变化 过 程 。 图 3. 20(a) 是 链 队 的 初始 状态 ,图 3. 20(b) 是 
在 链 队 中 3 个 元 素 进 队 后 的 状态 ,图 3. 20(c) 是 链 队 中 一 个 元 素 出 队 后 的 状态 。 
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图 3. 20 一 个 链 队 的 动态 变化 过 程 
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在 以 g 为 链 队 结 点 指针 的 链 队 ( 简 称 链 队 g) 中 ,可 以 归纳 出 对 后 面 算法 设计 来 说 非常 
重要 的 4 个 要 素 。 

。 队 空 的 条 件 : g 一 > rear 二 二 NULL( 也 可 以 为 g 一 > front= 二 = NULL)。 

。 队 满 的 条 件 : 不 考虑 。 
元 素 e 的 进 队 操作 : 新 建 一 个 结 点 存放 元 素 e( 由 p 指向 它 ), 将 结 点 p 插入 作为 尾 结 点 。 
出 队 操作 : 取出 队 首 结 点 的 data 值 并 将 其 删除 。 
在 链 队 上 对 应 队列 的 基本 运算 算法 设计 如 下 。 
1) 初始 化 队列 InitQueue(&q) 
构造 一 个 空 队 , 即 创建 一 个 链 队 结 点 ,其 front 和 rear 域 均 置 为 NULL。 算 法 如 下 : 








void InitQueue(LinkQuNode * &q) 

{ gq= (LinkQuNode * )malloc(sizeof(LinkQuNode) ) ; 
q—> front=q -> rear=NULL; 

} 


本 算法 的 时 间 复 杂 度 为 O(1) 。 
2) 销毁 队列 DestroyQueue(&q) 
释放 链 队 占 用 的 全 部 存储 空间 ,包括 链 队 结 点 和 所 有 数据 结 点 的 存储 空间 。 算 法 如 下 : 


void DestroyQueue(LinkQuNode * &.q) 


{ DataNode * pre=q—> front, * p; //pre 指向 队 首 结 点 
if (pre!= NULL) 
{ p=pre—> next; //p 指向 结 点 pre 的 后 继 结 点 
while (p!= NULL) //p 不 空 循环 
{ free(pre); // 释 放 pre 结 点 
pre 一 p;p 一 p 一 next; //pre,.p 同步 后 移 
} 
free(pre); // 释 放 最 后 一 个 数据 结 点 
} 
free(q); // 释 放 链 队 结 点 


本 算法 的 时 间 复 杂 度 为 O(n) ,其 中 为 链 队 中 数据 结 点 的 个 数 。 
3) 判断 队列 是 否 为 空 QueueEmpty(9q) 
若 链 队 为 空 ,返回 真 ; 否则 返回 假 。 算 法 如 下 : 





bool QueueEmpty(LinkQuNode * q) 
{ 

return(q 一 > rear== NULL); 
} 


本 算法 的 时 间 复 杂 度 为 0(1)。 

4) 进 队 列 enQueue(&q.e) 

创建 一 个 新 结 点 用 于 存放 元 素 e( 由 户 指 向 它 )。 若 原 队 列 为 空 , 则 将 链 队 结 点 的 两 个 域 
均 指向 结 点 p, 否 则 将 结 点 p 链接 到 单 链表 的 末尾 ,并 让 链 队 结 点 的 rear 域 指向 它 。 算 法 如 下 : 
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void enQueue(LinkQuNode * &q,ElemType e) 
{ DataNode * p; 
p 一 (DataNode * )malloc(sizeof(DataNode)); ”// 创 建新 结 点 


p 一 > data=e; 

p 一 next=NULL:; 

if (q—> rear== NULL) // 若 链 队 为 空 , 则 新 结 点 既是 队 首 结 点 又 是 队 尾 结 点 
qd 一 front 一 q 一 > rear 一 p; 

else // 若 链 队 不 空 

{ q—>rear—>next=p; // 将 结 点 p 链 到 队 尾 ,并 将 rear 指向 它 


q 一 rear 一 pi 
b 
} 


本 算法 的 时 间 复 杂 度 为 O(1) 。 

5) 出 队列 deQueue(&q ,&e) 

车 原 队列 为 空 , 则 下 溢出 返回 假 ; 车 原 队列 不 空 , 则 将 首 结 点 的 data 域 值 赋 给 e, 并 市 
除 之 , 若 原 队 列 只 有 一 个 结 点 , 则 需 将 链 队 结 点 的 两 个 域 均 置 为 NULL ,表示 队 列 已 为 空 。 
算法 如 下 : 


bool deQueue(LinkQuNode * &q,ElemType &e) 
{ DataNode * ti; 


if (q—> rear== NULL) // 原 来 队列 为 空 
return false; 

t=q 一 front; //t 指 向 首 结 点 

if (q—> front 一 一 q 一 > rear) // 原 来 队列 中 只 有 一 个 数据 结 点 时 
q—>front=q—> rear= NULL; 

else // 原 来 队列 中 有 两 个 或 两 个 以 上 结 点 时 
q 一 > front 一 q 一 > front 一 > next; 

e 一 t 一 > data; 

free(t); 


return true; 


} 


本 算法 的 时 间 复 杂 度 为 O(1) 。 

【 例 3.8】 采用 一 个 不 带头 结 点 只 有 一 个 尾 结 点 指针 rear 的 循环 单 链表 存储 队列 , 设 
计 队 列 的 初始 化 、 进 队 和 出 队 算 法 。 

本 例 的 链 队 如 图 3. 21 所 示 , 用 只 有 尾 结 点 指针 rear 的 循环 单 链表 作为 队列 存储 结 
构 , 其 中 每 个 结 点 的 类 型 为 LinkNode(LinkNode 为 单 链表 结 点 类 型 ,在 第 2 章 中 已 声明 )， 
rear 指针 用 于 唯一 标识 链 队 ,对 应 链 队 的 4 个 要 素 如 下 。 





rear 


队 头 | 队 尾 


al | CD | on 


图 3.21 用 只 有 尾 结 点 指针 的 循环 单 链表 作为 队列 存储 结构 
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队 空 的 条 件 : rear 二 二 NULL。 

队 满 的 条 件 : 不 考虑 。 

元 素 e 的 进 队 操作 : 新 建 一 个 结 点 存放 元 素 e( 由 p 指向 它 ), 将 结 点 p 插入 作为 尾 
让 rear 指向 这 个 新 的 尾 
出 队 操作 : 取出 队 头 结 点 (rear 所 指 结 点 的 后 继 结 点 ) 的 data 值 并 将 其 删除 。 


需要 注意 的 是 ,在 该 链 队 进 队 和 出 队 操作 后 链 队 或 者 为 空 ,或 者 为 一 个 不 带头 结 点 的 由 











尾 结 点 指针 rear 唯一 标识 的 循环 单 链表 ,不 能 改变 其 结构 特性 。 


对 应 的 队列 基本 运算 算法 如 下 : 
void initQueue(LinkNode * &rear) // 初 始 化 算法 
{ 
rear= NULL:; 
} 
void enQueue(LinkNode * &rear, ElemType e) // 进 队 算 法 
{ LinkNode *p; 
p 一 (LinkNode x )malloc(sizeof(LinkNode)); ”// 创 建新 结 点 
p 一 > data=e; 
if (rear== NULL) // 原 链 队 为 空 
{ p>next=p; // 改 为 循环 链表 
rear=p; //rear 指向 新 结 点 
} 
else // 原 链 队 不 空 
{ p—>next=rear—> next; // 将 p 结 点 插入 到 rear 结 点 之 后 
rear 一 > next=p; // 改 为 循环 链表 
rear=p; //rear 指向 新 结 点 
} 
bool deQueue(LinkNode * &rear,ElemType &e) // 出 队 算 法 
{ LinkNode *t; 
if (rear==NULL) // 队 空 


else if (rear 一 > next 一 一 rear) // 原 队 中 只 有 一 个 结 点 
{ ee 一 rear 一 > data; 
free(rear); 
rear 一 NULL; // 让 rear 为 空 链 表 
} 
else // 原 队 中 有 两 个 或 两 个 以 上 的 结 点 
{ trear 一 > next; //t 指 向 队 头 结 点 
e=t—> data; 
rear 一 > next 一 t 一 > next; // 删 除 t 结 点 
free(t); // 释 放 结 点 空间 
} 
return true; 
} 
bool queueEmpty(LinkNode * rear) // 判 队 空 算 法 


return false; 
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return(rear== NULL); 


324 队列 的 应 用 举例 


在 实际 应 用 中 ,队列 通常 作为 一 种 存放 临时 数据 的 容器 。 如 果 先 存 入 的 元 素 先 处 理 , 则 
采用 队列 。 本 小 节 通 过 报 数 问题 和 迷宫 问题 的 求解 过 程 介绍 队列 的 应 用 。 


1) 问题 描述 

设 有 个 人 站 成 一 排 ,从 左 向 右 的 编号 分 别 为 1 一 > 现在 从 左 往 右 报 数 “1,2,1,2,…”， 
数 到 “1 的 人 出 列 , 数 到 *2? 的 立即 站 到 队伍 的 最 右 端 。 报 数 过 程 反复 进行 ,直到 个 人 都 出 
列 为 止 。 要 求 给 出 他 们 的 出 列 顺序 。 

例如 , 当 n=8 时 初始 序列 为 : 





i 0 0 1 0 | 


则 出 列 顺序 为 : 














1 0 0 二 

2) 数据 组 织 

用 一 个 队列 解决 出 列 问题 ,由 于 这 里 不 需要 使 用 已 经 出 队 后 的 元 素 ,所 以 采用 环形 
队列 。 


3) 设计 运算 算法 

采用 的 算法 思想 是 先 将 n 个 人 的 编号 进 队 ,然后 反复 执行 以 下 操作 ,直到 队列 为 空 。 

(1) 出 队 一 个 元 素 ,输出 其 编号 ( 报 数 为 1 的 人 出 列 ) 。 

(2) 若 队 列 不 空 , 再 出 队 一 个 元 素 ,并 将 刚 出 列 的 元 素 进 队 ( 报 数 为 2 的 人 站 到 队伍 的 
最 右 端 , 即 队 尾 ) 。 

对 应 的 算法 如 下 : 


void number(int n) 
{ inti; ElemType e; 


SqQueue * qi // 环 形 队列 指针 q 
InitQueue(q) ; // 初 始 化 队列 q 
直下 二 // 构 建 初始 序列 


enQueue(q,iD; 


printf(" 报 数 出 列 顺序 :"); 


while (!QueueEmpty(q)) // 队 列 不 空 循环 

{ deQueue(g,e); // 出 队 一 个 元 素 e 
printf("%d ",e); // 输 出 元 素 编号 
if (!QueueEmpty(q)) // 队 列 不 空 
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{ deQueue(gq,e); // 出 队 一 个 元 素 e 
enQueue(q,e); // 将 刚 出 队 的 元 素 进 队 
} 
} 
printf("\n"); 
DestroyQueue(q) ; // 销 毁 队列 q 


} 


4) 设计 求解 程序 
设计 一 个 主 函 数 调用 上 述 算法 : 


int main() 

{ inti,n=8; 
printf(" 初 始 序 列 :"); 
for (i=1;i<=n;i 二 十) 

printf("%d ",iD; 

printf("\n"); 
number(n); 
return 1; 


} 


5) 运行 结果 
上 述 程序 的 运行 结果 如 下 : 


初始 序列 : 12345678 
报 数 出 列 顺序 : 13572648 


1) 问题 描述 

参见 3. 1. 4 节 的 问题 描述 。 

2) 数据 组 织 了 

用 队列 解决 求 迷宫 路 径 问 题 。 使 用 一 个 顺序 队 qu 保存 走 过 的 方块 ,该 训 
队列 的 类 型 声明 如 下 : 

















typedef struct 





{ inti,js // 方 块 的 位 置 
int pre; // 本 路 径 中 上 一 个 方块 在 队列 中 的 下 标 
} Box; // 方 块 类 型 
typedef struct 
{ Box dataLMaxSize] ; 
int front, rear; // 队 头 指针 和 队 尾 指针 
} QuType; // 顺 序 队 类 型 


这 里 使 用 的 顺序 队列 qu 不 是 环形 队列 ,因为 在 找到 出 口 时 需要 利用 队列 中 的 所 有 方块 
查找 一 条 迷宫 路 径 。 如 果 采 用 环形 队列 ,出 队 的 方块 可 能 被 新 进 队 的 方块 覆盖 ,从 而 无 法 求 
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出 迷宫 路 径 。 这 里 要 求 非 环形 队列 qu 有 足够 大 的 空间 。 

3) 设计 运算 算法 

搜索 从 入 口 (xi,y 让 到 出 口 (xe,ye) 路 径 的 过 程 是 ,首先 将 入 口 (xi,yi) 进 队 , 在 队列 qu 
不 为 空 时 循环 ,出 队 一 个 方块 e( 由 于 不 是 环形 队列 ,该 出 队 方 块 不 会 被 覆盖 ,其 下 标 为 
front) 。 然 后 查找 方块 e 的 所 有 相 邻 可 走 方块 ,假设 为 e 和 es 两 个 方块 ,将 它们 进 队 ,它们 
在 队列 中 的 位 置 分 别 为 rearl 和 rear2 ,并 且 将 它们 的 pre 均 设 置 为 front( 因 为 在 迷宫 路 径 
上 el 和 es 两 个 方块 的 前 一 个 方块 都 是 方块 e) ,如 图 3. 22 所 示 。 

方块 e 





front (DD 


方块 el 有 


rearl | @ 站 rear2 | (iz, 2) 


方块 el 的 pre 置 为 front 。 方块 ez 的 pre 置 为 front 
3.22 设置 相 邻 方块 的 pre 


























当 找 到 出 口 时 ,通过 出 口 方块 的 pre 值 前 推 找到 出 口 , 所 有 经 过 的 中 间 方 块 构成 一 条 迷 
宫 路 径 。 对 应 的 完整 过 程 如 下 : 


将 人 口 (xi,yiD 的 pre 置 为 一 1 并 进 队 ; 
mg[xi] [yi]=—1; 


while (队列 qu 不 空 ) 
{ 出 队 一 个 方块 e, 其 在 队列 中 的 位 置 是 front; 
if (方块 e 是 出 口 ) 
{ 输出 一 条 迷宫 路 径 ; 
return true; 


} 
for (对 于 方块 e 的 所 有 相 邻 可 走 方块 el) 
{ ”设置 el 的 pre 为 front; 
将 方块 el 进 队 ; 
将 方块 el 的 迷宫 数组 值 设 置 为 一 1; 
} 
} 
return false; // 没 有 迷宫 路 径 , 返 回 假 


实际 上 ,上 述 过 程 是 从 入 口 (xi,yi) 开 始 , 利 用 队列 的 特点 ,一 层 一 层 向 外 扩展 查找 可 走 
的 方块 ,直到 找到 出 口 为 止 ,这 个 方法 就 是 将 在 第 8 章 介绍 的 广度 优先 搜索 方法 。 

在 找到 出 口 后 ,输出 路 径 的 过 程 是 根据 当前 方块 ( 即 出 口 ,其 在 队列 qu 中 的 下 标 为 
front) 的 pre 值 回 推 找 到 迷宫 路 径 。 对 于 图 3. 11 所 示 的 迷宫 ,在 找到 出 口 后 ,队列 qu 中 
data 的 全 部 数据 如 表 3. 3 所 示 。 当 前 的 front 二 40,qu 一 > data[40]. pre 为 35 ,表示 路 径 上 
的 前 一 个 方块 为 qu 一 > data[35]; 而 qu 一 > data[35]. pre 为 30, 表 示 路 径 的 上 一 个 方块 为 
qu 一 > data[ 30]; qu 一 > data[ 30]. pre 为 27 ,表示 路 径 上 的 前 一 个 方块 为 qu 一 > data[27],…, 以 
此 类 推 ,找到 入 口 为 qu 一 > dataL0]。 在 对 应 的 print 函数 中 ,为 了 正 向 输出 路 径 , 在 前 面 的 
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9 
回 推 过 程 中 修改 路 径 上 每 个 方块 的 pre 值 , 使 该 迷宫 路 径 上 的 所 有 方块 的 pre 值 置 为 
一 1, 然 后 从 开头 输出 所 有 pre 为 一 1 的 方块 ,从 而 正 向 输出 了 一 条 迷宫 路 径 。 
表 3.3 队列 qu 中 data 的 全 部 数据 
下 标 i 了 pre 下 标 i pre 
0 1 下 = 21 1 6 18 
1 1 2 0 22 6 5 20 
2 2 1 0 23 5 5 22 
3 2 2 1 24 Cl 5 22 
4 3 1 2 25 4 5 23 
5 3 2 3 26 5 6 23 
6 4 . 4 27 8 5 24 
7 3 3 5 28 4 6 25 
8 5 1 6 29 5 va 26 
9 3 4 7 30 8 6 27 
10 5 2 8 31 8 4 27 
11 6 1 8 32 4 7 28 
12 2 4 9 33 5 8 29 
13 5 3 10 34 6 7 29 
14 Ed 1 11 35 8 30 
15 和 4 12 36 8 3 31 
16 2 5 12 37 3 32 
17 6 3 13 38 4 8 32 
18 1 5 15 39 6 8 33 
19 2 6 16 40 8 8 35 
20 6 4 17 
根据 上 述 搜索 过 程 得 到 以 下 用 队列 求解 迷宫 的 算法 : 
bool mgpathl(int xi, int yi, int xe,int ye) // 搜 索 路 径 为 (xi, yi)->(xe,ye) 
{ Boxe;s 
int i,j,di,il,jl; 
QuType * qu; // 定 义 顺序 队 指 针 qu 
InitQueue( qu); // 初 始 化 队列 qu 
ei=xir ejeyis epre™=—1s 
enQueue(qu, e); //(xi,yD 进 队 
mg[xi] [y]=—1; // 将 其 赋值 一 1, 以 避免 回 过 来 重复 搜索 
while (!QueueEmpty(qu)) // 队 不 空 循环 Do 
{ deQueue(qu,e); // 出 队 方 块 e, 由 于 不 是 环形 队列 ,该 出 队 元 素 仍 在 队列 中 
i=e.i; j=e.j; 








让 (i 二 二 xe && j 二 二 ye)  // 找 到 了 出 口 ,输出 路 径 
{ ”print(qu,qu 一 > front); // 调 用 print 函数 输出 路 径 
DestroyQueue(qu);  // 销 毁 队 列 
return true; // 找 到 一 条 路 径 时 返回 真 
} 
for (di=0;di<4;di 二 +) ”// 循 环 扫 描 每 个 方位 ,把 每 个 可 走 的 方块 插入 到 队列 中 
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{ switch(di) 

{ 

case 0:il=i—1; jl=j; break; 
case 1:il=i; jl=j+1; break; 
case 2:il=i+1; jl=j; break; 
case 3:il=i; jl=j—1; break; 
} 

if (mg[il] G1] ==0) 


{ e.i=il; e.j=jl; 


e.pre 一 qu 一 > front; // 指 向 路 径 中 上 一 个 方块 的 下 标 
enQueue(qu,e) ; /VCil ,jl1) 方 块 进 队 
mg[il] G1]=—1; // 将 其 赋值 一 1, 以 避免 回 过 来 重复 搜索 
} 
} 
} 
DestroyQueue( qu); // 销 毁 队 列 
return false; // 未 找到 任何 路 径 时 返回 假 
} 
void print(QuType * qu,int front) // 从 队列 qu 中 输出 一 条 迷宫 路 径 


{ intk=front,j,ns=0; 
printf("\n"); 
do // 反 向 找到 最 短路 径 , 将 该 路 径 上 的 方块 的 pre 成 员 设置 成 一 1 
Wks 
k=qu—> data[k] .pre; 
qu—> data[] .pre 一 一 1; 
} while (k!=0); 
printf(" 一 条 迷 官 路 径 如 下 :\n"); 
k=0; 
while (k < MaxSize) // 正 向 搜索 到 pre 为 一 1 的 方块 , 即 构成 正 向 的 路 径 
{ if (qu—>data[k].pre==—1) 
国电 
printf("\t( %d, %d)" ,qu 一 > data[k] .i, qu —> data[k] .j); 
i (ns%5 二 二 0) printf("\n"); // 每 输出 5 个 方块 后 换 一 行 
} 
k 十 十; 
} 
Pprintf("\n"); 
} 





4) 设计 求解 程序 


EE 建立 以 下 主 函 数 调用 上 述 算法 ， 


int main() 
{ if(!lmgpathl(l,1,M.,N)) 
printf(" 该 迷宫 问题 没有 解 !"); 


return 1; 
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5) 运行 结果 
对 于 图 3. 10 所 示 的 迷宫 ,求解 结果 如 下 : 


一 条 迷宫 路 径 如 下 : 
(1,1) (2,1) (3,1) (4,1) (5,1) 
(5,2) (5,3) (6,3) (6,4) (6,5) 
(7,5) (8,5) (8,6) (8,7) (8,8) 


上 述 迷 宫 路 径 的 显示 结果 如 图 3. 23 所 示 , 图 中 路 径 上 方块 (i,j) 中 的 箭头 指向 路 径 的 
前 一 个 相 邻 方块 ,例如 方块 (2,1) 的 箭头 是 “个 ”, 表 示 路 径 上 前 一 个 方块 是 方块 (1,1), 即 出 
口 。 显 然 这 个 解 是 最 优 解 ,也 就 是 最 短路 径 。 


入 口 








图 3.23 用 队列 求解 的 迷宫 路 径 





325 双 端 队列 
所 谓 双 端 队列 (deque,double-ended queue) 是 指 两 端 都 可 以 进行 进 队 
和 出 队 操作 的 队列 ,如 图 3. 24 所 示 。 将 队列 的 两 端 分 别称 为 前 端 和 后 端 ， 
两 端 都 可 以 进 队 和 出 队 。 其 元 素 的 逻辑 关系 仍 是 线性 关系 。 
前 端 进 


前 出 和 


3.24 一 个 双 端 队列 

















在 双 端 队列 中 进 队 时 ,前 端 进 的 元 素 排 列 在 队列 中 后 端 进 的 元 素 的 前 面 ,后 端 进 的 元 素 


排列 在 队列 中 前 端 进 的 元 素 的 后 面 。 在 双 端 队列 中 出 队 时 ,无 论 前 端 出 还 是 后 端 出 , 先 出 的 ~ 


元 素 排 列 在 后 出 的 元 素 的 前 面 。 

例如 有 a、b、c、d 元 素 进 队 ,能 否 产 生 dcab 的 出 队 序列 呢 ? 答案 是 肯定 的 。 其 操作 方式 
为 a 后 端 进 ,b 后 端 进 ,c 前 端 进 ,d 前 端 进 ,再 全 部 从 前 端 出 队 , 便 可 以 得 到 这 样 的 出 队 序 
列 。 那 么 是 不 是 可 以 通过 双 端 队列 得 到 任意 次 序 的 出 队 序列 呢 ? 答案 是 否定 的 ,例如 a、b、 
cd 元 素 进 队 就 不 能 产生 dacb 的 出 队 序列 ,因为 a 进 队 ,b 从 后 端 进 ,c 无论 从 前 端 进 还 是 从 
后 端 进 都 不 可 能 在 a、b 的 中 间 。 
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实际 上 ,从 前 面 的 双 端 队列 可 以 看 出 ,从 后 端 进 前 端 出 或 者 从 前 端 进 后 端 出 体现 先进 先 
出 的 特点 ,从 前 端 进 前 端 出 或 从 后 端 进 后 端 出 体现 出 后 进 先 出 的 特点 。 

在 实际 使 用 中 ,还 可 以 有 输出 受 限 的 双 端 队列 ( 即 允许 两 端 进 队 , 但 只 允许 一 端 出 队 的 
双 端 队列 ) 和 输入 受 限 的 双 端 队列 ( 即 允 许 两 端 出 队 , 但 只 允许 一 端 进 队 的 双 端 队列 ) ,前 者 
如 图 3. 25 所 示 , 后 者 如 图 3. 26 所 示 。 如 果 限 定 双 端 队列 中 从 某 端 进 队 的 元 素 只 能 从 该 端 
出 队 , 则 该 双 端 队列 就 晓 变 为 两 个 栈 底 相 邻 的 栈 了 。 


前 端 进 。。 前 中 后 站 


2 


图 3.25 一 个 输出 受 限 的 双 端 队列 


图 3.26 一 个 输入 受 限 的 双 端 队列 





【 例 3.9】 某 队 列 允 许 在 两 端 进 行人 队 操作 ,但 仅 允 许 在 一 端 进行 出 队 操作 , 若 a、b、c、 
de 元 素 进 队 , 则 以 下 不 可 能 得 到 的 顺序 有 哪些 ? 

(1) bacde (2) dbace (3) dbcae (4) ecbad 

本 题 的 队列 实际 上 是 一 个 输出 受 限 的 双 端 队列 ,这 样 的 双 端 队列 如 图 3. 25 所 示 。 

(1) a 后 端 进 ,b 前 端 进 ,c 后 端 进 ,d 后 端 进 ,e 后 端 进 , 全 出 队 。 

(2) a 后 端 进 ,b 前 端 进 ,c 后 端 进 ,d 前 端 进 ,e 后 端 进 ,全 出 队 。 

(3) a 后 端 进 ,b 前 端 进 , 因 d 未 出 ,此 时 只 能 进 队 ,c 怎么 进 都 不 可 能 在 ba 之 间 。 

(4) a 后 端 进 ,b 前 端 进 ,c 前 端 进 ,d 后 端 进 ,e 前 端 进 , 全 出 队 。 

所 以 不 可 能 得 到 的 顺序 为 (3) 。 

【 例 3. 10〗 如 果 人 允许 在 环形 队列 的 两 端 进行 插入 和 删除 操作 (这 样 的 队列 即 为 双 端 
队列 ) , 若 仍 采 用 前 面 定义 的 SqQueue 队列 类 型 ,设计 * 从 队 尾 删除 ”和 ”* 从 队 头 插入 ”的 
算法 。 

从 前 面 介绍 的 环形 队列 结构 可 以 看 到 , 队 头 指针 front 指向 队列 中 队 首 元 素 的 前 一 
个 位 置 ,而 队 尾 指针 rear 指向 队列 中 的 队 尾 元 素 。 所 以 “从 队 尾 删除 ”运算 应 先 提取 队 尾 元 
素 ,再 循环 后 退 一 个 位 置 ,而 “从 队 头 插入 ”运算 应 先 在 队 头 插入 元 素 ,再 循环 后 退 一 个 位 置 。 





实现 “从 队 尾 删除 ”运算 的 算法 如 下 : 
bool deQueuel (SqQueue * &q,ElemType &e) // 从 队 尾 删除 算法 
{ if(q->front==q—> rear) // 队 空 返回 假 
return false; 
e=q—> data[q —> rear] ; // 提 取 队 尾 元 素 


q 一 > rear 一 (q 一 > rear 一 1 十 MaxSize) % MaxSize; // 修 改 除 尾 指针 
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return true; 
} 
实现 “从 队 头 插入 ”运算 的 算法 如 下 : 
bool enQueuel (SqQueue * &q,ElemType e) // 从 队 头 插入 算法 
{ if((q—>reart+1)%MaxSize==q-> front) // 队 满 返 回 假 
return false; 
q—> data[q —> front] =e; // 元 素 e 进 队 
q—>front=(q—> front 一 1 十 MaxSize) % MaxSize; // 修 改 队 头 指针 


return true; 


本 音 的 基本 学 习 要 点 如 下 : 扫 -- 扫 

(1) 理解 栈 和 队列 的 特性 以 及 它们 之 间 的 差异 。 

(2) 掌握 栈 的 两 类 存储 结构 ( 即 顺序 栈 和 链 栈 ) 的 设计 特点 ,注意 顺序 
栈 和 链 栈 中 栈 满 和 栈 空 的 条 件 判 断 。 

(3) 掌握 在 顺序 栈 和 链 栈 中 实现 栈 的 基本 运算 的 算法 设计 方法 。 

(4) 掌握 队列 的 两 类 存储 结构 ( 即 顺序 队 和 链 队 ) 的 设计 特点 ,环形 队 
列 和 非 环 形 队列 的 差异 ,注意 各 种 存储 结构 中 队 满 和 队 空 的 条 件 判断 。 

(5) 掌握 在 顺序 队 和 链 队 中 实现 队列 的 基本 运算 的 算法 设计 方法 。 

(6) 理解 栈 和 队列 的 作用 ,知道 在 何 时 使 用 哪 一 种 数据 结构 ,用 栈 和 队列 求解 迷宫 问题 
的 差异 。 

(7) 灵活 地 运用 栈 和 队列 两 种 数据 结构 解决 一 些 综合 应 用 问题 。 















































1. 有 5 个 元 素 ,其 进 栈 次 序 为 A、B、.C、D、E, 在 各 种 可 能 的 出 栈 次 序 中 以 元 素 C.D 最 
先 出 栈 ( 即 C 第 一 个 且 D 第 二 个 出 栈 ) 的 次 序 有 哪 几 个 ? 

2. 在 一 个 算法 中 需要 建立 多 个 栈 (假设 3 个 栈 或 以 上 ) 时 可 以 选用 以 下 3 种 方案 之 一 ， 
试问 这 些 方案 相 比 各 有 什么 优 缺点 ? 





(1) 分 别 用 多 个 顺序 存储 空间 建立 多 个 独立 的 顺序 栈 。 aa 


(2) 多 个 栈 共 享 一 个 顺序 存储 空间 。 

(3) 分 别 建立 多 个 独立 的 链 栈 。 

3. 在 以 下 几 种 存储 结构 中 哪个 最 适合 用 作 链 栈 ? 
(1) 带头 结 点 的 单 链表 。 

(2) 不 带头 结 点 的 循环 单 链表 。 

(3) 带头 结 点 的 双 链 表 。 
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4. 简 述 以 下 算法 的 功能 (假设 ElemType 为 int 类 型 ) 。 


void fun(ElemType a[] ,int n) 
{ inti; ElemType e; 
SqStack * stl, * st2; 
InitStack(st1); 
InitStack(st2); 
for (i=0;i<nii 十 十 ) 
if (a[] %2==1) 
Push(stl1,a[d); 
else 
Push(st2,a[d ); 
i=0s 
while (!StackEmpty(st1)) 
{ Pop(stl,e); 
a[i 十 十 ] =e; 
} 
while (!StackEmpty(st2)) 
{ Pop(st2,e); 
a[i 十 十 ] 一 e; 





} 
DestroyStack(st1); 
DestroyStack( st2); 


5. 简 述 以 下 算法 的 功能 (顺序 栈 的 元 素 类 型 为 ElemType) 。 


void fun(SqStack * Bst, ElemType x) 
{ SqStack * tmps; 
ElemType e; 
InitStack(tmps); 
while( !StackEmpty(st)) 
{ Pop(st,e); 
if(e!l=x) Push(tmps, e); 
} 
while (!StackEmpty(tmps)) 
{ Pop(tmps,e); 
Push(st, e); 
} 
DestroyStack( tmps) ; 





6. 简 述 以 下 算法 的 功能 ( 栈 st 和 队列 qu 的 元 素 类 型 均 为 ElemType)。 


bool fun(SqQueue * &qu,int i) 
{ ElemType e; int j=1; 
int n 一 (qu 一 > rear 一 qu 一 > front+ MaxSize) % MaxSize; 
if G<1 | j>n) return false; 
for (j=1;j<=n;j+ 十 ) 
{ deQueue(qgu,e); 
让 站 (一 这 
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enQueue(qu, e); 
} 


return true; 


7. 什么 是 环形 队列 ? 采用 什么 方法 实现 环形 队列 ? 

8. 环形 队列 一 定 优 于 非 环形 队列 吗 ? 在 什么 情况 下 使 用 非 环形 队列 ? 

9. 假设 以 I 和 O 分 别 表示 进 栈 和 出 栈 操作 , 栈 的 初 态 和 终 栈 均 为 空 , 进 栈 和 出 栈 的 操 
作 序列 可 表示 为 仅 由 I 和 O 组 成 的 序列 。 

(1) 在 下 面 所 示 的 序列 中 哪些 是 合法 的 ? 

A. IOIIOIOO  B. IOOIOIIO C. IOIOIO  D. IIOOIOO 

(2) 通过 对 (1) 的 分 析 , 设 计 一 个 算法 判定 所 给 的 操作 序列 是 否 合法 ,车 合法 返回 真 , 否 
则 返回 假 ( 假 设 被 判定 的 操作 序列 已 存 入 一 维 数组 中 ) 。 

10. 假设 表达 式 中 允许 包含 圆 括号 . 方 括号 和 大 括号 3 种 括号 ,编写 一 个 算法 判断 表达 
式 中 的 括号 是 否 正确 配对 。 

11. 设 从 键盘 输入 一 序列 的 字符 wa ,as,… ,a,。 设 计 一 个 算法 实现 这 样 的 功能 : 若 a; 
为 数字 字符 ,ai 进 队 ; 若 a; 为 小 写字 母 ,将 队 首 元 素 出 队 ; 若 ai 为 其 他 字符 ,表示 输入 结 
束 。 要 求 使 用 环形 队列 。 

12. 设计 一 个 算法 ,将 一 个 环形 队列 (容量 为 ”元素 下 标 从 0 到 ”一 1) 的 元 素 倒 置 。 例 
如 ,图 3.27(a) 中 为 倒置 前 的 队列 (n= 二 10) ,图 3.27(b) 中 为 倒置 后 的 队列 。 





图 3.27 一 个 环形 队列 倒置 前 后 的 状态 


13. 编写 一 个 程序 ,输入 n( 由 用 户 输 入 ) 个 10 以 内 的 数 ,每 输入 i(0 达 i 过 9) 就 把 它 插 入 
到 第 i 号 队列 中 ,最 后 把 10 个 队 中 的 非 空 队列 按 队列 号 从 小 到 大 的 顺序 串 接 成 一 条 链 , 并 





输出 该 链 的 所 有 元 素 。 Se 


一 ~ 上 机 实验 题 3 一 


戎 给 证 性 实验 
实验 题 1: 实现 顺序 栈 的 各 种 基本 运算 的 算法 
目的 领会 顺序 栈 存 储 结构 和 掌握 顺序 栈 中 的 各 种 基本 运算 算法 设计 。 
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内 容 : 编写 一 个 程序 sqstack. cpp, 实 现 顺 序 栈 (假设 栈 中 元 素 类 型 ElemType 为 char) 
的 各 种 基本 运算 ,并 在 此 基础 上 设计 一 个 程序 exp3-1. cpp 完成 以 下 功能 。 

(1) 初始 化 栈 s。 

(2) 判断 栈 * 是否 非 空 。 

(3) 依次 进 栈 元 素 a、b、c、d、e。 

(4) 判断 栈 * 是 否 非 空 。 

(5) 输出 出 栈 序列 。 

(6) 判断 栈 s 是 否 非 空 。 

(7) 释放 栈 。 


实验 题 2: 实现 链 栈 的 各 种 基本 运算 的 算法 

目的 : 领会 链 栈 存储 结构 和 掌握 链 栈 中 的 各 种 基本 运算 算法 设计 。 

内 容 : 编写 一 个 程序 listack. cpp, 实 现 链 栈 (假设 栈 中 元 素 类 型 ElemType 为 char) 的 
各 种 基本 运算 ,并 在 此 基础 上 设计 一 个 程序 exp3-2. cpp 完成 以 下 功能 。 

(1) 初始 化 栈 ;。 

(2) 判断 栈 * 是 否 非 空 。 

(3) 依次 进 栈 元 素 a、b、c、d、e。 

(4) 判断 栈 ; 是 否 非 空 。 

(5) 输出 出 栈 序列 。 

(6) 判断 栈 * 是 否 非 空 。 

(7) 释放 栈 。 


实验 题 3: 实现 环形 队列 的 各 种 基本 运算 的 算法 

目的 : 领会 环形 队列 存储 结构 和 掌握 环形 队列 中 的 各 种 基本 运算 算法 设计 。 

内 容 : 编写 一 个 程序 sqqueue. cpp, 实 现 环 形 队列 ( 假 设 栈 中 元 素 类 型 ElemType 为 
char) 的 各 种 基本 运算 ,并 在 此 基础 上 设计 一 个 程序 exp3-3. cpp 完成 以 下 功能 。 

(1) 初始 化 队列 g。 

(2) 判断 队列 g 是 否 非 空 。 

(3) 依次 进 队 元 素 a、b、c。 

(4) 出 队 一 个 元 素 , 输 出 该 元 素 。 

(5) 依次 进 队 元 素 d、e、f。 

(6) 输出 出 队 序列 。 

(7) 释放 队列 。 


实验 题 4: 实现 链 队 的 各 种 基本 运算 的 算法 

目的 : 领会 链 队 存储 结构 和 掌握 链 队 中 的 各 种 基本 运算 算法 设计 。 

内 容 : 编写 一 个 程序 liqueue. cpp, 实 现 链 队 (假设 栈 中 元 素 类 型 ElemType 为 char) 的 
各 种 基本 运算 ,并 在 此 基础 上 设计 一 个 程序 exp3-4. cpp 完成 以 下 功能 。 

(1) 初始 化 链 队 gq。 

(2) 判断 链 队 gq 是 否 非 空 。 

(3) 依次 进 链 队 元 素 a、b、c。 
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(4) 出 队 一 个 元 素 , 输 出 该 元 素 。 

(5) 依次 进 链 队 元 素 d、e、f。 

(6) 输出 出 队 序 列 。 

(7) 释放 链 队 。 
戎 设计 性 实验 

实验 题 5: 用 栈 求解 迷宫 问题 的 所 有 路 径 及 最 短路 径 程序 

目的 : 掌握 栈 在 求解 迷宫 问题 中 的 应 用 。 

内 容 : 编写 一 个 程序 exp3-5. cpp, 改 进 3.1. 4 节 的 求解 迷宫 问题 程序 ,要 求 输出 图 3. 28 
所 示 的 迷宫 的 所 有 路 径 , 并 求 第 一 条 最 短路 径 长 度 及 最 短路 径 。 


实验 题 6: 编写 病人 看 病 模拟 程序 

目的 : 掌握 队列 应 用 的 算法 设计 。 

内 容 : 编写 一 个 程序 exp3-6. cpp, 反 映 病人 到 医院 
排队 看 医生 的 情况 。 在 病人 排队 过 程 中 主要 重复 下 面 

出 口 两 件 事 。 

(1) 病人 到 达 诊 室 , 将 病历 本 交 给 护士 , 排 到 等 待 
队列 中 候诊 。 

(2) 护士 从 等 待 队列 中 取出 下 一 位 病人 的 病历 ,该 


入 口 





图 3.28 迷宫 示意 图 


病人 进入 诊室 就 诊 。 
要 求 模拟 病人 等 待 就 诊 这 一 过 程 。 程 序 采用 菜单 方式 ,其 选项 及 功能 说 明 如 下 : 
: 排队 一 一 输入 排队 病人 的 病历 号 ,加 入 到 病人 排队 队列 中 ; 
: 就 诊 一 一 病人 排队 队列 中 最 前 面 的 病人 就 诊 , 并 将 其 从 队列 中 删除 ; 
: 查看 排队 一 一 从 队 首 到 队 尾 列 出 所 有 的 排队 病人 的 病历 号 ; 
: 不 再 排队 ,余下 依次 就 诊 一 一 从 队 首 到 队 尾 列 出 所 有 的 排队 病人 的 病历 号 ,并 退出 运行 。 
:下班 一 一 退出 运行 。 
实验 题 7: 求解 栈 元 素 排序 问题 
目的 : 掌握 栈 应 用 的 算法 设计 。 
内 容 : 编写 一 个 程序 exp3-7. cpp, 按 升序 对 一 个 
字符 栈 进行 排序 , 即 最 小 元 素 位 于 栈 顶 ,最 多 只 能 使 
用 一 个 额外 的 栈 存 放 临 时 数据 ,并 输出 栈 排序 过 程 。 





an mo 性 
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名 综 合 性 实验 3 
实验 题 8: 用 本 求解 皇后 问题 . 
目的 : 深入 掌握 楼 应 用 的 算法 设计 。 





内 容 : 编写 一 个 程序 exp3-8. cpp 求解 n 皇后 问 
题 , 即 在 nXn 的 方 格 棋盘 上 放置 个 皇后 ,要 求 每 
个 皇后 不 同行 .不 同 列 、 不 同 左 右 对 角 线 ,图 3. 29 是 
八 皇 后 问题 的 一 个 解 。(1) 皇后 个 数 z 由 用 户 输 入 ， 
其 值 不 能 超过 20, 输 出 所 有 的 解 (2) 采 用 类 似 于 用 栈 
求解 迷宫 问题 的 方法 。 图 3.29 八 皇后 问题 
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实验 题 9: 编写 停车 场 管 理 程序 
目的 : 深入 掌握 栈 和 队列 应 用 的 算法 设计 。 
内 容 : 编写 满足 以 下 要 求 的 停车 场 管 理 程序 exp3-9. cpp。 设 停车 场 内 只 有 一 个 可 停放 
nn 辆 汽车 的 狭长 通道 , 且 只 有 一 个 大 门 可 供 汽 车 进出 。 
汽车 在 停车 场 内 按 车 辆 到 达 时 间 的 先后 顺序 依次 由 南 向 北 排列 (大 门 在 最 北端 ,最 先 到 
达 的 第 一 辆 车 停放 在 停车 场 的 最 南端 ) , 若 停车 场 内 已 停 满 ， 辆 车 , 则 后 来 的 汽车 只 能 在 门 
外 的 便道 ( 即 候 车 场 上 ) 等 候 ,一 旦 有 车 开 走 , 则 排 在 便道 上 的 第 一 辆 车 即 可 开 入 ; 当 停车 场 
内 某 辆 车 要 离开 时 ,在 它 之 后 进入 的 车 辆 必须 先 退 出 停车 场 为 它 让 路 , 待 该 辆 车 开 出 大 门 
外 ,其 他 车 辆 再 按 原 次 序 进入 停车 场 ,每 辆 停放 在 停车 场 的 车 在 它 离 开 停车 场 时 必须 按 停留 
的 时 间 长 短 交 纳 费 用 。 整 个 停车 场 的 示意 图 如 图 3. 30 所 示 。 
出 进 一 
Ti / 候车 场 
北 





图 3.30 停车 场 示意 图 





字符 串 简称 为 串 , 串 是 由 字符 元 素 构成 的 , 其 中 元 素 的 逻辑 关 
系 也 是 一 种 线性 关系 。 串 的 处 理 在 计算 机 非 数 值 处 理 中 点 有 重要 
的 地 位 , 如 信息 检索 系统 ,文字 编辑 等 都 是 以 串 数据 作为 处 理 对 象 。 

本 章 介绍 串 的 基本 概念 、 串 的 存储 结构 、 串 的 基本 运算 和 模式 
匹配 算法 设计 。 
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串 的 基本 概念 米 


串 (string) 是 由 零 个 或 多 个 字符 组 成 的 有 限 序 列 。 含 零 个 字符 的 串 称 为 空 串 ,用 作 表 

。 串 中 所 含 字符 的 个 数 称 为 该 串 的 长 度 ( 或 串 长 )。 通 常 将 一 个 串 表 示 成 "aa …av "的 形 
式 .其 中 最 外 边 的 又 引导 (或 音 引 号 ) 不 是 串 的 内 容 , 它 们 是 的 标志 ,用 于 将 中 与 标识 符 ( 如 
变量 名 等 ) 加 以 区 别 。 每 个 a;(1<i<n) 代 表 一 个 字符 ,不 同 的 机 器 和 编程 语言 对 合法 字符 
( 即 允许 使 用 的 字符 ) 有 不 同 的 规定 。 但 在 一 般 情况 下 ,英文 字母 数字 (0,1,… ,9) 和 常用 的 
标点 符号 以 及 空格 符 等 都 是 合法 的 字符 。 

两 个 串 相等 当 上 且 仅 当 这 两 个 串 的 长 度 相等 并 且 各 对 应 位 置 上 的 字符 都 扫 -- 扫 
相同 。 一 个 申 中 任意 个 连续 字符 组 成 的 序列 称 为 谈 串 的 子 帅 (supstring)， RR 
例如 串 "abcde" 的 子 串 有 "a"、"ab"、"abc" 和 "abcd" 等 。 为 了 表述 清楚 ,在 串 
中 空格 字符 用 “加 符号 表示 ,例如 "a 品 b" 是 一 个 长 度 为 4 的 串 , 其 中 含有 两 
个 空格 字符 。 空 串 是 不 包含 任何 字符 的 串 ,其 长 度 为 0, 空 串 是 任何 串 的 
子 串 。 

串 的 抽象 数据 类 型 描述 如 下 : 
































ADT String 
{ ”数据 对 象 : 
D={ ai| 1<i<n,n 宇 0,ai 为 char 类 型 } 
数据 关系 : 
R={<ai,ait> | ai\am ED,i=1, -…,n—1} 
基本 运算 : 
StrAssign( &s,cstr): 将 字符 串 常量 cstr 赋 给 串 s, 即 生成 其 值 等 于 cstr 的 串 s。 
DestroyStr( &s): 销毁 串 ,释放 为 串 * 分 配 的 存储 空间 。 
StrCopy(&s,1): 串 复制 ,将 串 上 赋 给 串 s。 
StrEqual(s,t): 判断 串 是 否 相等 , 若 两 个 串 ;与 + 相等 则 返回 真 ; 否则 返回 假 。 
StrLength(s): 求 串 长 ,返回 串 * 中 字符 的 个 数 。 
Concat(s,t): 串 连 接 , 返 回 由 两 个 串 ; 和 + 连接 在 一 起 形成 的 新 串 。 
SubStr(s,i, 让 ): 求 子 串 ,返回 串 ;中 从 第 i(1<i<n) 个 字符 开始 的 由 连续 j 
个 字符 组 成 的 子 串 。 
InsStr(sl,i,s2) : 子 串 插入 ,将 串 s2 插入 到 串 s1 的 第 i(1i<n 十 了) 个 位 置 ， 
并 返回 产生 的 新 串 。 
Delstr(s 汪 7: 子 串 删除 ,从 串 ;中 删 去 从 第 i(1<i<n) 个 字符 开始 的 长 度 为 j 的 
子 串 , 并 返回 产生 的 新 串 。 
RepStr(s,i,j,t): 子 串 替换 ,在 串 * 中 将 第 i(1<i<<n) 个 字符 开始 的 j 个 字符 构 
成 的 子 串 用 串 1 替换 ,并 返回 产生 的 新 串 。 
DispStr(s): 串 输出 ,输出 串 * 的 所 有 字符 值 。 


串 的 存储 结构 米 


和 线性 表 一 样 , 串 也 有 顺序 存储 结构 和 链 式 存储 结构 。 前 者 简称 为 顺序 串 , 后 者 简称 为 
链 串 。 
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421 串 的 顺序 存储 结构 一 一 顺序 串 


顺序 串 中 的 字符 被 依次 存放 在 一 组 连续 的 存储 单元 里 。 一 般 来 说 ,一 个 字 节 (8 位 ) 可 
以 表示 一 个 字符 (存放 其 ASCII 码 ) 。 而 计算 机 内 存 是 按 字 编 址 的 , 即 以 字 为 存储 单位 ,一 
个 存储 单元 指 的 是 一 个 字 。 而 一 个 字 可 能 包含 多 个 字 节 ,其 所 包含 的 字 节 数 随机 器 而 异 。 

顺序 串 的 存储 方式 有 两 种 : 一 种 是 每 个 字 只 存 一 个 字符 ,如 图 4.1 所 示 ( 假 设 一 个 字 包 
含 4 个 字 节 ) ,这 称 为 非 紧缩 格式 (其 存储 密度 小 ); 另 一 种 是 每 个 字 存放 多 个 字符 ,如 图 4.2 
所 示 ,这 称 为 紧缩 格式 (其 存储 密度 大 ) 。 在 这 两 个 图 中 ,有 阴影 的 字 节 为 空闲 部 分 。 















































001 | 扫 -- 扫 
1002 | 8 

1003 | C 

1004|D 3 
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图 4.1 非 紧缩 格式 示例 图 4.2 紧缩 格式 示例 


串 的 紧缩 格式 节省 存储 空间 ,但 处 理 单个 字符 不 太 方便 ,运算 效率 低 , 因 为 需要 花费 时 
间 从 同一 个 字 中 分 离 字符 ; 相反 , 非 紧 缩 格式 比较 浪费 存储 空间 ,但 处 理 单个 字符 或 者 一 组 
连续 字符 方便 。 后 面 主要 讨论 后 者 。 

对 于 非 紧 缩 格式 的 顺序 串 , 其 类 型 声明 如 下 : 


typedef struct 


{ char data[MaxSize] ; // 存 放 串 字符 
int length; // 存 放 串 长 
} SqString; // 顺 序 串 类 型 


下 面 讨 论 在 顺序 串 上 实现 串 基 本 运算 的 算法 ,其 中 顺序 串 参 数 采 用 直接 传递 顺序 串 的 
方法 ,不 同 于 第 2 章 的 顺序 表 算法 采用 的 是 顺序 表 指针 。 

1) 生成 串 StrAssign(&s ,cstr) 

将 一 个 C/C++ 字符 串 常 量 cstr( 以 \0' 字 符 标识 结尾 ) 赋 给 顺序 串 *, 即 生成 一 个 其 值 等 





于 cstr 的 串 s。 算 法 如 下 : 


void StrAssign(SqString &s,char cstr[]) //s 为 引用 型 参数 
{int ls 
for (i=0;cstr[] != "\0';i+ 十 ) 
s.data[i] =cstr[] ; 
s.length=i; // 设 置 串 s 的 长 度 


PIGOOO 


2) 销毁 串 DestroyStr(&s) 

由 于 本 章 的 顺序 串 是 直接 采用 顺序 串 本 身 来 表示 的 ,而 不 是 顺序 串 指针 , 它 的 存储 空间 
由 操作 系统 管理 , 即 由 操作 系统 分 配 其 存储 空间 ,并 在 超出 作用 域 时 释放 其 存储 空间 ,所 以 
这 里 的 销毁 顺序 串 运算 不 包含 任何 操作 。 算 法 如 下 : 


void DestroyStr(SqString &s) 
|! 


3) 串 的 复制 StrCopy(&s ,1t) 
将 顺序 串 1 复制 给 顺序 串 s。 算 法 如 下 : 


void StrCopy(SqString &.s, SqString t) //s 为 引用 型 参数 
{ inti; 
for (i=0;i<t.length;i 十 十 ) // 复 制 t 的 所 有 字符 
s.data[i] =t. data[] ; 
s.length=t. length; // 设 置 串 s 的 长 度 


} 


4) 判断 串 相 等 StrEqual(s,t) 
若 两 个 顺序 串 * 与 + 相等 返回 真 ; 否则 返回 假 。 算 法 如 下 : 


bool StrEqual(SqString s, SqString t) 
{ bool same=true; int i; 
if (s.length!=t. length) // 长 度 不 相等 时 返回 0 
same 一 false; 
else 
for (i 王 0;i< s.length;i 十 十 ) 
if (s.data[i] !=t. data[] ) // 有 一 个 对 应 字符 不 相同 时 返回 假 
{ same=false; 
break; 
} 
return same; 


i 


5) 求 串 长 StrLength(s) 
返回 顺序 串 ; 中 字符 的 个 数 。 算 法 如 下 : 


int StrLength(SqString s) 
{ 





ER return s. length; 


y 


6) 串 的 连接 Concat(s,t) 
返回 由 两 个 顺序 串 ; 和 4 连接 在 一 起 形成 的 结果 串 。 算 法 如 下 : 


SuString Concat(SqString s, SqStrine t) 
{ SqString str; // 定 义 结果 串 
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int 1; 
str.length 一 s.length 十 t.length; 
for (i 王 0;i<s.length;i 十 十 ) 
str.data[i] =s. data[i] ; 
for (i=0;i<t.length;it+ 二 +) 
str. data[s. lengtht+i]=t. data[d] ; 
return str; 





7) 求 子 串 SubStr(s ,i,j) 


返回 顺序 串 s 中 从 第 i(1<<i<n) 个 字符 开始 的 由 连续 j 个 字符 组 成 的 子 串 。 当 参数 不 


正确 时 返回 一 个 空 串 。 算 法 如 下 : 


SqString SubStr(SqString s,int i,int j) 


{0 int ks 
SqString str; // 定 义 结果 串 
str. length=0; // 设 置 str 为 空 串 
if (i<=0 | i>s.length || j<0 | i 十 j 一 1>s.length) 
return str; // 参 数 不 正 确 时 返回 空 串 


for (k 王 i 一 1;k<i 十 j 一 1;k 十 十 ) 
str.data[k—i+1]=s. data[lk] ; 

str. length=j; 

return str; 


8) 子 串 的 插入 InsStr(s1,i,s2) 


将 顺序 串 s2 插入 到 顺序 串 s1 的 第 i(1 志 i 志 n 十 1D) 个 位 置 上 ,并 返回 产生 的 结果 串 。 当 


参数 不 正确 时 返回 一 个 空 串 。 算 法 如 下 : 


SqString InsStr(SqString sl ,int i, SqString s2) 


1 Mints 
SqString str; // 定 义 结果 串 
str. length=0; // 设 置 str 为 空 串 
if (i<=0 | i>sl.length 十 1) // 参 数 不 正 确 时 返回 空 串 


return str; 
for (j=0j<i lt ty 
str.data[j] = sl1. data[D] ; 
for (j=0;j< s2.length;j 十 十 ) 
str. data[i+j—1]=s2.dataD]; 
for (j=i—1;j<sl.length;j+ 二 ) 
str. data[s2. length+j] =s1. data[] ; 
str. length= sl. length++ s2. length:; 
return str; 


9) 子 串 的 删除 DelStr(s,i,j) 


// 将 s.data[0..s.length 一 1] 复 制 到 str 


// 将 t.data[0..t.length 一 1] 复 制 到 str 


// 将 s.data[i..i 十 j 一 巧 复制 到 str 


// 将 sl.data[0..i 一 2] 复 制 到 str 
// 将 s2.data[0..s2.length 一 1 复制 到 str 


// 将 sl.data[i 一 1..sl.length 一 1 复制 到 str 


@00 ,4 





在 顺序 串 ;中 删 去 从 第 i(1<i<<n) 个 字符 开始 的 长 度 为 j 的 子 串 , 并 返回 产生 的 结果 
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串 。 当 参数 不 正确 时 返回 一 个 空 串 。 算 法 如 下 : 


SqString DelStr(SqString s, int i,int j) 


{ int ks 
SqString str; // 定 义 结果 串 
str. length=0; // 设 置 str 为 空 串 
if (i<=0 | i>s.length || i 十 j>s.length 十 1) 
return str; // 参 数 不 正 确 时 返回 空 串 
for (k 王 0;k<i 一 1;k 十 十 ) // 将 s.data[0..i 一 2] 复 制 到 str 


str.data[k]=s. data[k] ; 

for (k 王 i 十 j 一 1;k< s.length;k 十 十 ) // 将 s.data[i 十 j 一 1..s.length 一 1 复制 到 str 
str. data[k—j] =s. data[k] ; 

str. length=s. length—j; 

return str; 


} 


10) 子 串 的 替换 RepStr(s,i,j,t) 
在 顺序 串 * 中 将 第 ;(1 近 过 思 个 字符 开始 的 连续 7 个 字符 构成 的 子 串 用 顺序 串 : 蔡 换 ， 
并 返回 产生 的 结果 串 。 当 参数 不 正确 时 返回 一 个 空 串 。 算 法 如 下 : 


SqString RepStr(SqString s, int i, int j,SqString t) 


0 Lit ks 
SqString str; // 定 义 结果 串 
str. length=0; // 设 置 str 为 空 串 
if (i<=0 || i>s.length || i 十 j 一 1> s.length) 
return str; // 参 数 不 正 确 时 返回 空 串 
for (k 王 0;k<i 一 1;k 十 十 ) // 将 s.data[0..i 一 2] 复 制 到 str 
str. data[k] =s. data[k] ; 
for (k 王 0;k<t.length;k 十 十 ) // 将 t.data[0..t.length 一 1 复制 到 str 


str. data[i+k—1]=t. data[k] ; 

for (k 一 i 十 j 一 1;k< s.length;k 十 十 ) // 将 s.data[i 十 j 一 1..s.length 一 1 复制 到 str 
str. data[t. length+k—j] =s. data[k] ; 

str. length=s. length—j+t. length; 

return str; 


11) 输出 串 DispStr(s) 
输出 顺序 串 * 的 所 有 元 素 值 。 算 法 如 下 : 





void DispStr(SqString s) 
nt 
if (s.length> 0) 
{ for (i=0;i<s.length;i 十 十 ) 
printf("%e", s. data[]); 
printf("\n"); 
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【 例 4.1】 


s 和 z 的 大 小 。 
本 例 的 算法 思路 如 下 。 


(1) 比较 s 和: 两 个 串 共同 长 度 范 围 内 的 对 应 字符 : 
Q@ 若 的 字符 大 于 :上 的 字符 ,返回 1; 

@ 车 的 字符 小 于 : 的 字符 ,返回 一 1; 

@ 若 的 字符 等 于 :上 的 字符 , 按 上 述 规则 继续 比较 。 
(2) 当 (1) 中 的 对 应 字符 均 相同 时 比较 ; 和 : 的 长 度 : 


@ 两 者 相等 时 返回 0; 


@ ;的 长 度 大 于 1 的 长 度 ,返回 1; 
@ ;的 长 度 小 于 1 的 长 度 ,返回 一 1。 


对 应 的 算法 如 下 : 


int Strcmp(SqString s, SqString t) 


{ 


} 


【 例 4.2】 


int i, comlen; 


if (s.length<t.length) comlen=s. length; // 求 s 和 +t 的 共同 长 度 


else comlen=t. length; 
for (i=0;i<comlen;i+ 十 ) 
if (s. data[i]> t. data[] ) 


return 1; 


else if (s.data[i]<t. data[i]) 


returmn —1; 
if (s.length==t. length) 
return 0; 
else if (s.length> t. length) 
return 1; 
else return —1; 


相同 字符 构成 的 平台 。 


用 index 保存 最 长 的 平台 在 s 中 的 开始 位 置 ,maxlen 保存 其 长 度 , 先 将 它们 初始 化 
为 0。 扫 描 串 ;, 计 算 局 部 重复 子 串 的 长 度 length, 若 比 maxlen 大 , 则 更 新 maxlen, 并 用 
index 记 下 其 开始 位 置 。 扫 描 结 束 后 ,s. data[L index..index 十 maxlen 一 1] 为 第 一 个 最 长 的 平 


台 。 对 应 的 算法 如 下 : 


假设 串 采 用 顺序 串 存储 ,设计 一 个 算法 Stremp(s,1) 按 字典 顺序 比较 两 个 串 


假设 串 采 用 顺序 串 存 储 , 设 计 一 个 算法 求 串 * 中 出 现 的 第 一 个 最 长 的 连续 


// 在 共同 长 度 内 逐个 字符 比较 


//s==t 
//s>t 


//s<t 





void LongestString(SqString s,int &index,int &maxlen) 


{ 


int length,i 一 1,start; 

index 一 0,maxlen 一 1; 

while (i< s.length) 

{ start 一 i 一 1; 
length 一 1; 


//length 保存 局 部 平台 的 长 度 
//index 保存 最 长 平台 在 s 中 的 开始 位 置 , maxlen 保存 其 长 度 


// 查 找 局 部 重复 子 串 


while (i< s.length && s.data[i] ==s. data[i—1]) 


{ i 
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length 十 十 ; 
} 
if (maxlen < length) // 当 前 平台 长 度 大 , 则 更 新 maxlen 
{ maxlen=length; 
index= start; 
} 
Es 





422 串 的 链 式 存储 结构 一 一 链 串 


串 采用 链 式 存储 结构 存储 时 称 为 链 串 , 这 里 采用 带头 结 点 的 单 链 表 作 
为 链 串 。 链 串 的 组 织 形式 与 一 般 的 单 链表 类 似 , 主要 区 别 在 于 链 串 中 的 一 
个 结 点 可 以 存储 多 个 字符 。 通 常 将 链 串 中 每 个 结 点 所 存储 的 字符 个 数 称 为 
结 点 大 小 。 图 4. 3 和 图 4. 4 分 别 表示 同一 个 串 "ABCDEFGHIJKLMN" 的 结 点 大 小 为 4( 存 
储 密度 大 ) 和 1( 存 储 密度 小 ) 时 的 链 串 结构 。 
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图 4.3 结 点 大 小 为 4 的 链 串 
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图 4.4 结 点 大 小 为 1 的 链 串 


















































当 结 点 大 小 大 于 1( 例 如 结 点 大 小 为 4) 时, 链 串 的 尾 结 点 的 各 个 数据 域 不 一 定 总 能 全 被 
字符 占 满 ,此 时 应 在 这 些 未 占用 的 数据 域 里 补 上 不 属于 字符 集 的 特殊 符号 (例如 '# ' 字 符 )， 
以 示 区 别 ( 参 见 图 4. 3 中 的 尾 结 点 ) 。 

在 链 串 中 , 结 点 大 小 越 大 ,存储 密度 越 大 ,但 一 些 基 本 操作 (如 搬入、 删除 .替换 等 ) 有 所 
不 便 , 且 可 能 引起 大 量 字符 移动 ,因此 它 适 合 于 串 很 少 修改 的 情况 ; 结 点 大 小 越 小 (如 结 点 
大 小 为 1 时 ) ,相关 操作 的 实现 越 方便 ,但 存储 密度 下 降 。 为 简便 起 见 ,这 里 规定 链 串 结 点 大 
小 均 为 1。 

链 串 的 结 点 类 型 LinkStrNode 的 声明 如 下 : 


typedef struct snode 


{ char data; // 存 放 字符 
struct snode * next; // 指 向 下 一 个 结 点 的 指针 
} LinkStrNode; // 链 串 的 结 点 类 型 


下 面 讨 论 在 链 串 上 实现 串 基 本 运算 的 算法 设计 。 
1) 生成 串 StrAssign(&s .cstr) 
将 一 个 C/C++ 字符 串 常 量 cstr( 以 \0 "标识 结尾 ) 赋 给 链 串 *, 即 生成 一 个 其 值 等 于 cstr 
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的 链 串 *。 以 下 算法 采用 尾 插 法 建立 链 串 s。 


void StrAssign(LinkStrNode * &s,char cstr[]) 
人 
LinkStrNode *r,*p; 
s 一 (LinkStrNode * )malloc(sizeof(LinkStrNode) ) ; 
r=s; //r 始 终 指向 尾 结 点 
for (i=0;cstr[] != "\0';i+ 二 +) 
{ p=(LinkStrNode * )malloc(sizeof(LinkStrNode)); 
p 一 > data=cstr[] ; 
T 一 > next 一 p; r 一 pi; 
} 
r—> next=NULL; // 尾 结 点 的 next 域 置 为 空 


2) 销毁 串 DestroyStr(&s) 
该 运算 和 销毁 带头 结 点 单 链表 运算 的 实现 过 程 相 同 。 算 法 如 下 : 


void DestroyStr(LinkStrNode * &s) 
{ LinkStrNode * pre 二 s, * p 二 s > next;  //pre 指 向 结 点 p 的 前 驱 结 点 


while (p!= NULL) // 扫 描 链 串 s 
{free(pre); // 释 放 pre 结 点 
pre=p; //pre\p 同步 后 移 一 个 结 点 


p=pre—> next; 


} 


free(pre); // 循 环 结束 时 p 为 NULL, pre 指向 尾 结 点 ,释放 它 


3) 串 的 复制 StrCopy(&s ,t) 
将 链 串 1 复制 给 链 串 s。 以 下 算法 采用 尾 插 法 建立 复制 后 的 链 串 *。 


void StrCopy(LinkStrNode * &.s,LinkStrNode * t) 
{ LinkStrNode * p=t—> next, *q, *r; 
s= (LinkStrNode * )malloc(sizeof(LinkStrNode) ) ; 


I=s; //r 始终 指向 尾 结 点 

while (p!=NULL) // 扫 描 链 串 t 的 所 有 结 点 

{ gq=(LinkStrNode * )malloc(sizeof(LinkStrNode) ) ; 
q 一 > data=p —> data; // 将 p 结 点 复制 到 q 结 点 
r—> next=q; r=q; // 将 q 结 点 链接 到 链 串 s 的 末尾 
p=p—> next; 

} 

r—> next=NULL; // 尾 结 点 的 next 域 置 为 空 


4) 判断 串 相等 StrEqual(s ,t) 


若 两 个 链 串 * 与 1 的 长 度 相 等 且 对 应 位 置 的 字符 均 相 同 , 则 返回 真 ; 否则 返回 假 。 算 法 


如 下 : 
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bool StrEqual(LinkStrNode * s,LinkStrNode * t) 
{ LinkStrNode * p 一 s 一 > next, * q 一 t 一 > next; //p、q 分 别 扫描 链 串 s 和 t 的 数据 结 点 
while (p!=NULL && q!=NULL && p—> data==q—> data) 
{ p=p—>next; 
qd=q—> next; 
} 
if (p==NULL && gq==NULL) //s 和 t 的 长 度 相 等 且 对 应 位 置 的 字符 均 相同 
return true; 
else 
return false; 


} 


5) 求 串 长 StrLength(s) 
通过 遍历 链 串 * 的 所 有 数据 结 点 求 其 个 数 并 返回 。 算 法 如 下 : 


int StrLength(LinkStrNode * s) 


{ inti=0; //i 用 于 累计 数据 结 点 的 个 数 
LinkStrNode x*p 一 s -> next;  //p 指 向 链 串 s 的 首 结 点 
while (p!= NULL) // 扫 描 所 有 数据 结 点 
, 

Pp=Pp—> next; 
} 
return i; 


} 


6) 串 的 连接 Concat(s,t) 

由 两 个 链 串 * 和 4 的 数据 结 点 连接 在 一 起 形成 结果 串 。 以 下 算法 采用 尾 持 法 建立 连接 
后 的 结果 链 串 str 并 返回 它 。 

LinkStrNode * Concat(LinkStrNode * s,LinkStrNode *t) 


{ LinkStrNode * str, * p=s—> next, *q, *r; 
str= (LinkStrNode * )malloc(sizeof(LinkStrNode) ) ; 





r=str; //r 指 向 结果 串 的 尾 结 点 

while (p!= NULL) // 用 Pp 扫描 s 的 所 有 数据 结 点 

{ q=(LinkStrNode * )malloc(sizeof(LinkStrNode)); 
q—> data=p —> data; // 将 p 结 点 复制 到 q 结 点 中 
T 一 > next=q;r=q; // 将 q 结 点 链接 到 str 的 末尾 
p=p—> next; 

} 

p=t—> next; 

| while (p!=NULL) // 用 Pp 扫描 t 的 所 有 数据 结 点 

{ q=(LinkStrNode * )malloc(sizeof(LinkStrNode) ) ; 
q -> data=p —> data; // 将 p 结 点 复制 到 q 结 点 中 
T 一 > next 一 qir 一 q; // 将 q 结 点 链接 到 str 的 末尾 
p=p—> next; 

} 

r—> next=NULL; // 尾 结 点 的 next 域 置 为 空 

return str; 
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7) 求 子 串 SubStr(s,i,j) 
返回 链 串 s 中 从 第 ;入 i 委 思 个 字符 开始 的 由 连续 7 个 字符 组 成 的 子 串 。 当 参数 不 正 
确 时 返回 一 个 空 串 。 以 下 采用 尾 插 法 建立 结果 链 串 str 并 返回 它 。 


LinkStrNode * SubStr(LinkStrNode * s,int i,intj) 
{ intk; 
LinkStrNode * str, * p=s—> next, *q, *r; 
str= (LinkStrNode * )malloc(sizeof(LinkStrNode) ) ; 


str —> next=NULL; // 置 结果 串 str 为 空 串 
r=str; //r 指 向 结果 串 的 尾 结 点 
if (i<=0 || i> StrLength(s) || j<0 || i+j—1> StrLength(s)) 
return str; // 参 数 不 正 确 时 返回 空 串 
for (k 王 1;k<i;k 十 十 ) // 让 Pp 指向 链 串 s 的 第 i 个 数据 结 点 
p=p—> next; 
for C= lk ty // 将 s 的 从 第 i 个 结 点 开始 的 j 个 结 点 复制 到 str 


{ gq= (LinkStrNode * )malloc(sizeof(LinkStrNode) ) ; 
q 一 > data=p 一 > data; 
IT 一 > next 一 q;I 一 q; 
p 一 D 一 > next; 
} 
r—>next=NULL; // 尾 结 点 的 next 域 置 为 空 


return str; 


8) 子 串 的 插入 InsStr(s1,i.,s2) 

将 链 串 52 插入 到 链 串 s1 的 第 i(1 志 i 过 n 十 了 ) 个 位 置 上 ,得 到 一 个 结果 串 。 当 参数 不 正 
确 时 返回 一 个 空 串 。 以 下 采用 尾 插 法 建立 结果 链 串 str 并 返回 它 。 

LinkStrNode * InsStr(LinkStrNode * s,int i,LinkStrNode * t) 

{ intk; 


LinkStrNode * str, * p=s—> next, * pl=t—> next, * q, * 1; 
str= (LinkStrNode * )malloc(sizeof(LinkStrNode) ) ; 


str > next= NULL:; // 置 结果 串 str 为 空 串 

r=str; //r 指 向 结果 串 的 尾 结 点 

if (i<=0 | i> StrLength(s) 十 1) // 参 数 不 正 确 时 返回 空 串 
return str; 

for (k=1;k<i;k 二 十) // 将 s 的 前 i 个 结 点 复制 到 str 


{ q=(LinkStrNode * )malloc(sizeof(LinkStrNode) ) ; 
q—> data=p —> data; 
r—> next 一 qir 一 qi; 





p=p—> Dext; aa 


} 
while (pl!= NULL) // 将 t 的 所 有 结 点 复制 到 str 
{ gq= (LinkStrNode * )malloc(sizeof(LinkStrNode) ) ; 

q 一 > data 一 pl] 一 > data; 

r=-> next™qr™ qs 

pl=pl] 一 > next; 
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while (p!=NULL) // 将 p 结 点 及 其 后 的 结 点 复制 到 str 
{ gq= (LinkStrNode * )malloc(sizeof(LinkStrNode) ) ; 
q—> data=p 一 > data; 
r-> next=q;r=q; 
p=p—> next; 
} 
r—>next=NULL; // 尾 结 点 的 next 域 置 为 空 


return str; 


9) 子 串 的 删除 DelStr(s,i,j) 
在 链 串 * 中 删 去 从 第 i(1<i<n) 个 字符 开始 的 长 度 为 j 的 子 串 ,得 到 一 个 结果 串 。 当 
参数 不 正确 时 返回 一 个 空 串 。 以 下 采用 尾 插 法 建立 结果 链 串 str 并 返回 它 。 


LinkStrNode * DelStr(LinkStrNode * s,int i,int j) 
{ int ki; 
LinkStrNode * str, * p=s—> next, * q, *r; 
str= (LinkStrNode * )malloc(sizeof(LinkStrNode) ) ; 


str —> next= NULL; // 置 结果 串 str 为 空 串 
r=str; //r 指 向 结果 串 的 尾 结 点 
if (i<=0 |‖ i>StrLength(s) || j<0 | 计 j 一 1> StrLength(s)) 
return str; // 参 数 不 正 确 时 返回 空 串 
for (k 王 1;k<i;k 十 十 ) // 将 s 的 前 i 一 1 个 结 点 复制 到 str 


{ q= (LinkStrNode * )malloc(sizeof(LinkStrNode)); 
q—> data=p 一 > data; 
-> next™=qrr™eqs 


p=p—> next; 
} 
for (k 王 0;k<j;k 十 十 ) // 让 p 沿 next 跳 j 个 结 点 
p 一 p 一 > next; 
while (p!= NULL) // 将 p 结 点 及 其 后 的 结 点 复制 到 str 
{ q=(LinkStrNode * )malloc(sizeof(LinkStrNode) ) ; 
q—> data=p -> data; 
fr-> next™—qsr™=os 
p=p—> next; 
} 
r—> next=NULL:; 
return str; // 尾 结 点 的 next 域 置 为 空 


} 





10) 子 串 的 替换 RepStr(s.,i.j,t) 
在 链 串 * 中 将 从 第 i(1 志 i 个 字符 开始 的 j 个 字符 构成 的 子 串 用 链 囊 1 蔡 换 。 当 参 
数 不 正 确 时 返回 一 个 空 串 。 以 下 采用 尾 插 法 建立 链 串 str 并 返回 其 地 址 。 算 法 如 下 : 


LinkStrNode * RepStr(LinkStrNode * s,int i,int j,LinkStrNode * t) 
{ int ki; 
LinkStrNode * str, * p=s—> next, * pl=t—> next, * q， 关 工 ; 
str= (LinkStrNode * )malloc(sizeof(LinkStrNode) ) ; 
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str —> next=NULL; // 设 置 结果 串 str 为 空 串 

r=str; //r 指 向 新 建 链表 的 尾 结 点 

if (i<=0 | i> StrLength(s) || j<0 | ij 一 1> StrLength(s)) 
return str; // 参 数 不 正确 时 返回 空 串 


for (k 王 0;k<i 一 1;k 十 十 ) // 将 s 的 前 i 一 1 个 数据 结 点 复制 到 str 
{ gq=(LinkStrNode * )malloc(sizeof(LinkStrNode) ) ; 

q 一 data 一 p 一 dataiq —> next=NULL; 

T 一 > next=q;r=q; 


P=Pp-> nexts 

} 

for (k 王 0;k<j;k 十 十 ) // 让 p 沿 next 跳 j 个 结 点 
p=p—> next; 

while (pl!= NULL) // 将 t 的 所 有 数据 结 点 复制 到 str 


{ gq= (LinkStrNode * )malloc(sizeof(LinkStrNode) ) ; 
q—>data=pl 一 data;qd —> next= NULL; 
T 一 > next=q;r=q; 
pl 一 pl 一 > next; 
} 
while (p!= NULL) // 将 p 所 指 结 点 及 其 后 的 结 点 复制 到 str 
{ gq= (LinkStrNode * )malloc(sizeof(LinkStrNode) ) ; 
q—>data=p—> data;q —> next= NULL; 
IT 一 > next 一 qi;T 一 qj; 
P=p~> next; 
} 
r—>next=NULL; // 尾 结 点 的 next 域 置 为 空 
return str; 


} 


11) 输出 串 DispStr(s) 
输出 串 s 的 所 有 元 素 值 。 算 法 如 下 : 


void DispStr(LinkStrNode * s) 


{ LinkStrNode * p=s—> next; //p 指向 链 串 s 的 首 结 点 
while (p!=NULL) // 扫 描 s 的 所 有 数据 结 点 
{printf("%e",p—> data); // 输 出 p 结 点 值 


p 一 p 一 > next; 
} 
printf("\n"); 
} 





【 例 4.3】 假设 串 采 用 链 串 存储 ,设计 一 个 算法 把 串 * 中 最 先 出 现 的 子 串 "ab" 改 为 
"ys 

在 串 s 中 找到 最 先 出 现 的 子 串 "ab" , 即 p 指向 data 域 值 为 'a' 的 结 点 ,其 后 继 结 点 是 
data 域 值 为 b' 的 结 点 。 将 它们 的 data 域 值 分 别 改 为 'x'" 和 'z', 再 创建 一 个 data 域 值 为 'y' 的 结 
点 (由 g 指向 它 ) ,将 其 插入 到 p 所 指 的 结 点 之 后 。 算 法 如 下 : 


void Repl(LinkStrNode * &s) 
{ LinkStrNode * p=s—> next, *q; 


ET 人 OO 


bool find 王 false; 


while (p!=NULL && p—>next!=NULL && !find) // 查 找 'ab' 子 串 
{ if(p—>data=='a'B&& p—>next—> data=='b') // 找 到 了 这 样 的 子 串 
{ p>data='x'; p—>next-—>data='z'; // 替 换 


q= (LinkStrNode * )malloc(sizeof(LinkStrNode)); 
q—>data='y'; q—> next=p—> next; p—> next=q; 
find= true; 
} 
else p=p 一 > next; // 尚 未 找到 时 继续 查找 
} 


串 的 模式 匹配 


设 有 两 个 串 s 和 上, 串 上 的 定位 就 是 要 在 串 * 中 找到 一 个 与 + 相等 的 子 串 。 通 常 把 ; 称 
为 目标 串 (target string) ,把 1 称 为 模式 串 (pattern string) ,因此 串 定位 查找 也 称 为 模式 匹配 
(pattern matching)。 模 式 匹 配 成 功 是 指 在 目标 串 ; 中 找到 了 一 个 模式 串 :; 不 成 功 则 指 目 
标 串 * 中 不 存在 模式 串 1。 

模式 匹配 是 一 个 比较 复杂 的 串 操 作 , 许 多 人 对 此 提出 了 很 多 效率 各 不 相同 的 算法 。 在 
此 介绍 两 种 算法 ,并 设 串 均 采用 顺序 存储 结构 。 


431 BruteForce 算 法 


Brute-Force( 暴 力 ) 简 称 为 BF 算法 ,也 称 简单 匹配 算法 ,采用 穷 举 方法 ,其 基本 思路 是 
从 目标 串 :一 "sos si "的 第 一 个 字符 开始 和 模式 串 :一 "toa…to-i "中 的 第 一 个 字符 比较 ， 
若 相等 , 则 继续 逐个 比较 后 续 字 符 ; 否则 从 目标 串 ; 的 第 二 个 字符 开始 重新 扫 -- 扫 
与 模式 串 1 的 第 一 个 字符 进行 比较 。 依 此 类 推 , 若 从 模式 串 * 的 第 i 个 字符 上 
开始 ,每 个 字符 依次 和 目标 串 上 中 的 对 应 字符 相等 , 则 匹配 成 功 ,该 算法 返 
回 位 置 ;表示 此 时 /上 的 第 一 个 字符 在 * 中 出 现 的 下 标 ); 否则 ,匹配 失败 , 即 9 
! 不 是 * 的 子 串 , 算 法 返回 一 1( 这 里 为 了 简便 , 均 使 用 物理 下 标 ) 。 视频 讲解 
例如 设 目 标 串 ;二 "aaaaab" ,模式 串 /二 "aaab" ,BF 模式 匹配 的 直观 过 
程 如 图 4.5 所 示 。 

















s: aaaaab 
1: aaab 从 s 的 第 1 个 字符 开始 匹配 名 失败 
EE 1 a a a b 从 的 第 2 个 字符 开始 匹配 失败 
f a a a b 从 s 的 第 3 个 字符 开始 匹配 咏 成 功 


图 4.5 BF 模式 匹配 的 直观 过 程 








假设 目标 串 * 中 含有 n 个 字符 ,模式 串 1 中 含有 m 个 字符 ,用 i 扫描 目标 串 s 的 字符 ,用 
7 扫描 模式 串 : 的 字符 : 
(1) 第 ZL(! 从 1 开始 ) 趟 匹配 是 从 s 中 的 字符 :与 上 中 的 第 一 个 字符 避 比较 开始 的 。 


所 OO 





(2) 在 某 一 趟 匹配 中 出 现 s; 二 4 , 则 ij 后 移 继 续 字 符 比较 , 即 执行 i 十 十 ,j 十 十 。 

(3) 在 某 一 趟 匹配 中 出 现 # 天 局 ( 称 为 “ 失 配 ?) ,如 图 4.6 所 示 , 则 有 $s-j 二 40 ,si-j+i 二 
一 1; 即 to~4j-1 的 j 个 字符 依次 与 目标 串 s 中 s; 之 前 的 j 个 字符 相同 。 也 就 是 
说 ,本 趟 匹配 是 从 目标 串 * 的 s;-; 字 符 比 较 开 始 的 , 即 为 第 ;一 7 十 1 趟 匹配 ,由 于 匹配 失败 ， 
下 一 趟 匹配 应 该 是 第 i 一 j 十 2 趟 匹配 , 即 从 目标 串 、 中 的 si+: 与 比较 开始 。 所 以 ,无 论 
当前 是 第 几 趟 匹配 ,只 要 出 现 失 配 , 即 s; 去 4; , 则 执行 ;一 ;一 7) 十 1( 表 示 开 始 下 一 趟 匹配 ,从 目 
标 串 * 中 的 s + 开始 比较 , 即 庆 回溯) ,一 0( 每 趟 匹配 都 是 从 x 开始 的 ) 。 


证 本 越 匹配， 从 ,与 比较 开 
[| | 始 ， 直 到 s 与 ! 不 相等 为 上 
Ss SO .5 
[a } 下 一 趟 匹配 ， 从 su 与 6 
并 


图 4.6 BF 模式 匹配 的 一 般 性 过 程 


(4) 在 匹配 中 一 旦 7 超 界 (j= 二 =m) ,表示 模式 串 1 的 所 有 字符 与 目标 串 s 的 对 应 字符 均 相 
同 , 则 :是 * 的 子 串 , 即 模式 匹配 成 功 ,并 且 1 在; 中 的 位 置 是 i 一 m。 

(5) 如 果 按 上 述 过 程 匹配 ,出 现 i 超 界 (i 二 n) ,表示 模式 匹配 失败 。 

(6) BF 算法 过 程 是 从 /二 1 开始 的 , 若 模式 匹配 成 功 则 返回 ,否则 /二 2,…。 由 于 穷 举 
了 所 有 的 情况 ,所 以 BF 算法 是 正确 的 。 

对 于 前 例 , 目 标 串 ;二 "aaaaab" ,模式 串 1 二 "aaab" 。s 的 长 度 z 一 6,: 的 长 度 冯 一 4。i 
分 别 扫 描 目 标 串 s 和 模式 串 +:。BF 模式 匹配 的 过 程 如 图 4.7 所 示 , 总 共 需 要 12 次 字符 比较 
(恰好 为 字符 间 纵 向 连接 线条 数 ) 。 











计 
第 1 趟 匹配 s:aaaaab -i=3 jij+1= 
ONE=0, 0 开始 ) “ i 站 
1: aaab 3 = 
本 
计 
第 2 趟 匹配 s:aaaaab 人 i=i-j+1=2 
(从 1 广 0 开始 ) |||} 3 。 失败; 修改 为 
1: aaab 0 
本 
计 
第 3 趟 匹 =6 
人 人 “人 ， 成 功 ， 返 回 六 Liength-2 
1: aaab 2 
4 
4.7 ”BF 模式 匹配 的 过 程 ~ 
对 应 的 BF 算法 如 下 : 
int BF(SqString s, SqString t) 


W000 
while (i< s.length && j<t.length)  // 两 个 串 都 没有 扫描 完 时 循环 
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{ if(s.data[i]==t.data0]) // 当 前 比较 的 两 个 字符 相同 
人 // 依 次 比较 后 续 的 两 个 字符 
else // 当 前 比较 的 两 个 字符 不 相同 
(二 二 j 十 15 研 07) // 扫 描 目标 串 的 i 回 退 , 子 串 从 头 开始 匹配 
} 
if (>=t.length) //i 超 界 , 表 示 t 是 s 的 子 串 
return(i—t. length); // 返 回 t 在 s 中 的 位 置 
else // 模 式 匹配 失败 
Teturn( 一 1); // 返 回 一 1 


} 


这 个 算法 简单 且 易 于 理解 ,但 效率 不 高 ,主要 原因 是 主 串 指针 i 在 若干 个 字符 比较 相等 
后 ,车 有 一 个 字符 比较 不 相等 ,就 需 回溯 ( 即 一 :一 ) 十 1)。 该 算法 在 最 好 情况 下 的 时 间 复 杂 
度 为 OCm) , 即 主 串 的 前 mw 个 字符 正好 等 于 模式 串 的 m 个 字符 。 在 最 坏 情 况 下 的 时 间 复 杂 
度 为 O(nXm)。 可 以 证 明 其 平均 时 间 复 杂 度 也 是 O(nXm) ,也 就 是 说 ,该 算法 的 平均 时 间 
性 能 接近 最 坏 的 情况 。 


432 KVP 算 法 

KMP 算法 是 D. E. Knuth、J. H. Morris 和 V. R. Pratt 共同 提出 的 , 称 之 为 Knuth- 
Morris-Pratt 算法 ,简称 KMP 算法 。 该 算法 与 Brute-Force 算法 相 比 有 较 大 的 改进 ,主要 是 
消除 了 主 串 指针 的 回溯 ,从 而 使 算法 效率 有 了 某 种 程度 的 提高 。 

a 





在 KMP 算法 中 ,通过 分 析 模 式 串 上 从 中 提取 出 加 速 匹配 的 有 用 信息 。 这 种 信息 是 对 
于 4 的 每 个 字符 1 (0<j 三 m 一 1) 存 在 一 个 整数 k(k<j) ,使 得 模式 串 1 中 开头 的 & 个 字符 
《won…ts-1) 依 次 与 4 的 前 面 & 个 字符 (wj-4t1…4y-1, 这 里 第 一 个 字符 4-4 最 多 从 4 开 
始 , 所 以 &<j) 相 同 。 如 果 这 样 的 & 有 多 个 , 取 其 中 最 大 的 一 个 。 模 式 串 4 
中 每 个 位 置 ; 的 字符 都 有 这 种 信息 ,采用 next 数组 表示 , 即 next[ jj] = 
MAX{k}。 

例如 模式 串 /二 "aaab" ,对 于 j= 二 3,ts 二 'b', 有 4 二 w= 二 "a'( 即 4 的 前 面 
有 一 个 字符 和 开头 的 一 个 字符 相同 ) ,k= 二 1; 又 有 ts4 二 wt 二 "aa"( 即 is 的 
前 面 有 两 个 字符 和 开头 的 两 个 字符 相同 ),k 二 2; 所 以 ,next[3] 一 
MAX{1,2}=2。 

归纳 起 来 , 求 模式 串 1 的 next 数组 的 公式 如 下 : 

















生肖 当 j 一 0 时 
next[j] 二 MAX{k | 0<k<j 且 "toatlrn" 三 "ie 6-"}》 当 此 集合 非 空 时 
0 其 他 情况 
next 数组 的 求解 过 程 如 下 : 








(1) next[0] 1l,nextL1]=0G 王 1, 在 1 一 7) 一 1 的 位 置 上 没有 字符 ,属于 其 他 情况 ) 。 
(2) 如 果 next[ 门 一 上 ,表示 有 "to 让 -一 "一 一 1: 


Q@ 若 关 去 六 ,说 明 误 之 前 不 存在 长 度 为 next[j] 十 1 的 子囊 和 开头 字符 起 的 子 串 相同 ， 
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那么 是 否 存在 一 个 长 度 较 短 的 子 串 和 开头 字符 起 的 子 串 相同 呢 ? 设 &' 二 next[k]( 回 退 )， 
则 下 一 步 应 该 将 二 与 比较 : 车 4 二 tw, 则 说 明之 前 存在 长 度 为 next[k'] 十 1 的 子囊 和 
开头 字符 起 的 子 串 相 同 ; 否则 依 此 类 推 找 更 短 的 子 串 ,直到 不 存在 可 匹配 的 子 串 , 置 
next[D7 十 1 一 0。 所 以 , 当 太 夫 访 时, 置 人 一 next[k]。 

对 应 的 求 模式 串 1 的 next 数组 的 算法 如 下 : 


void GetNext(SqString t, int next[]) // 由 模式 串 t 求 出 next 数组 


{ intj,k; 
j=0;k=—1; //j 扫描 tk 记录 t 四 之 前 与 + 开头 相同 的 字符 个 数 
next[0]=—1; // 设 置 next[0] 值 
while (j<t.length—1) // 求 t 所 有 位 置 的 next 值 
{这 (k== 一 1 |‖ t.data0]===t.data[k]) ”//k 为 一 1 或 比较 的 字符 相等 时 
EN //i\k 依次 移 到 下 一 个 字符 
nextD]=k; // 设 置 next 中 为 k 
} 
else k=next[k] ; //k 回 退 


} 


【 例 4. 4】 求 模式 串 1 二 "aaab" 的 next 数组 。 

next[0]= 一 1,next[1]=0。 

j 二 2 时 ,1~j 一 1 的 位 置 上 只 有 一 个 字符 'a' 与 1 的 开头 字符 相同 ,所 以 next[2]=1。 

j 二 3 时 ,1~j 一 1 的 位 置 上 7s 的 前 面 有 字符 串 "a" 和 "aa" 均 与 1 的 开头 字符 串 相 同 ,所 
以 next[3]=2。 

归纳 起 来 ,模式 串 4 对 应 的 next 数组 如 表 4. 1 所 示 。 


表 4.1 模式 串 上 的 next 数 组 











0 1 2 3 
t[)] a a a b 
next[j] = 0 1 2 


2~NP 算 沁 的 模式 人 E 配 过 程 

当 求 出 模式 串 1 的 next 数组 表示 的 信息 后 ,就 可 以 用 来 消除 主 串 指针 的 回溯 .这 里 仍 
以 目标 串 ;二 "aaaaab" ,模式 串 1 二 "aaab" 为 例 说 明 。 

第 1 趟 匹配 是 从 ;= 王 0 一 0 开始 的 , 失 配 处 为 i 二 3,j 二 3。 尽 管 本 趟 匹配 失败 了 ,但 得 





到 这 样 的 “部 分 匹配 "信息 : wss 与 zs 相同 ,如 图 4. 8(a) 所 示 。 I 


而 模式 串 1 中 有 next[3] 二 2, 表 明 4 二 wo :所 以 有 ss 一 to ,如 图 4.8(b) 所 示 。 

原来 第 2 趟 匹配 是 从 i 王 1 一 0 开始 的 , 即 需要 回溯 。 现 在 既然 有 ss 一 to 成 立 , 第 2 
趟 匹配 可 以 从 ;一 3 一 2( 一 next[3]) 开 始 , 如 图 4. 8(c) 所 示 , 即 保持 主 串 指针 i 不 变 , 模 式 
串 上 右 滑 一 (一 ) 一 next[ 门 ) 个 位 置 , 让 s; 和 ta 对齐 进 行 比较 。 

下 面 讨论 一 般 情 况 , 设 目标 串 := "sosi…s-i" ,模式 串 1 二 "wot1…1m-1" ,在 进行 第 i 一 j 十 
1 趟 匹配 (从 s;-; 开 始 ) 时 出 现 如 图 4.9 所 示 的 失 配 情况 Cs 天方 ) 。 


137 





数据 结构 教程 利 昌 @ 







































































it 计 计 
s:a[la aja ab s:a[a ala ab s:a[a alaab 

+ | 
1t:ala ajb f:a alab 1 aalab 

飞 4 7 


(a) s3A6 (b) 5s15=04 (c) 1 右 滑 


4.8 利用 next 值 消除 主 串 指针 的 回溯 


目标 串 s :sos … sr SHI 31 5 Sil -oe Sn! 


| 1+ 


模式 串 + 而 看 
图 4.9 目标 串 和 模式 串 匹配 的 一 般 情况 
这 时 的 部 分 匹配 是 "oo 和 和 … 放 -一 Si 


四 四 
batt tl = Si 一 ktSi 一 t+1 Si 一 1 


因为 next[j==k, 即 : 


-1" ,显然 在 k<j 时 有 : 


" 





(4.1) 

to 有 (4.2) 

由 以 上 两 式 说 明 "wonw…t-1" 二 "5si-at1…$i-1" 成立。 下 一 趟 就 不 再 从 5;-j+1 开 始 匹 

配 ,而 是 从 %-* 开 始 匹配 ,并 且 直 接 将 s; 和 4 进行 比较 ,这 样 可 以 把 第 i 一 j 十 1 趟 比较 “ 失 
配 ” 时 的 模式 串 1 从 当前 位 置 直接 右 滑 j 一 k 个 字符 ,如 图 4. 10 所 示 。 

目标 证: sosi 5 spySpptl ee Sh SESERH ese SHA 可， 人 

部 分 匹配 :个 字 和 | 
模式 捉 1: 7 


由 WR 








目标 串 8s: m 8 .…。 8PSHrl SF SS ee. SEL Si oes Sl 
模式 申 4: EE tS 


由 下 一 越 从 si 开始 


目标 电 8: S081 SpySpytee SLE SASLht oe Si SS) ee Sn 


比较 : 1 右 滑 jk 个 字符 
模式 串 1: rr 





PE he 


4. 10 模式 串 右 滑 j 一 k 个 字符 


上 述 过 程 中 ,从 第 ;一 /十 1 趟 匹配 (从 % 一 开始 ) 直 接 转 到 第 ;一 A 十 1 趟 匹配 (从 %-* 开 
始 ) ,中 间 可 能 遗漏 一 些 匹配 趟 数 ( 即 第 ;一 7 十 2 趟 一 第 i 一 & 趟 ) ,那么 KMP 算法 是 否 正确 
呢 ? 实际 上 ,因为 next[j] 二 k, 容 易 证 明 中 间 的 匹配 赵 数 是 不 必要 的 。 

通过 一 个 示例 进行 验证 。 设 目标 串 = 王 "sosiszssstsise", 模 式 串 上 一 
"whtztstts" ,next[5j 二 2。 从 5 开始 匹配 (第 2 趟 ) , 失 配 处 为 天 上 ,这 里 
i 一 6,j 一 5, 人 一 2, 下 面 说 明 第 i 一 7 十 2( 王 3) 一 第 i 一 上 (一 4) 趟 是 不 必 
要 的 。 


























视频 讲解 
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如 图 4. 11 所 示 ,部 分 匹配 信息 有 "itzts44" 二 "szsss4ss"。 因 为 next[5] 一 2, 有 "45 "一 
"ts44" ,同时 有 "wotitzts" 关 "htztst4"( 若 相等 , 则 next[5] 二 4 而 不 是 2) ,从 而 推出 "spsss4ss "天 
"wotitsta"。 所 以 从 ss 开始 匹配 (第 3 趟 ) 是 不 必要 的 。 


目标 串 s: ss ma $54 Ss 36 








模式 串 1: tt bb 6 next[5]=2 
”02 82535455" 
tolitats" # " titotala" 


目标 串 s:s ss $54 Ss 56 











模式 串 1: Hh bh hh 


图 4.11 没有 必要 从 s, 开始 匹配 


同样 ,因为 next[5] 二 2, 有 "iol1ts" 关 "tzts44"( 若 相等 , 则 next[5] 二 3 而 不 是 2) ,推出 从 
5 开始 匹配 (第 4 趟 ) 是 不 必要 的 。 下 一 趟 应 该 从 % 开始 匹配 (第 5 趟 ) ,而 且 直 接 将 se 与 i 
进行 比较 。 

所 以 , 当 模式 串 上 中 心 与 目标 串 中 某 个 字符 s; 失 配 时 ,用 next[0] 王 一 1 表示 1 中 已 经 
没有 字符 与 当前 字符 ;; 进 行 比较 了 。i 应 该 移动 到 目标 串 * 的 下 一 个 字符 ,再 和 模式 串 1 中 
第 一 个 字符 进行 比较 。 

另外 ,BF 算法 的 匹配 过 程 是 第 1 趟 从 % 和 ww 比较 开始 ,第 2 趟 从 5 和 尖 = 光 
4o 比较 开始 ,第 3 趟 从 s。 和 4o 比较 开始 , 依 此 类 推 。 而 KMP 算法 的 第 1 趟 
从 so。 和 4。 比较 开始 ,第 2 趟 不 一 定 从 5 开始 ,所 以 和 BF 算法 相 比 可 能 会 
减少 匹配 的 趟 数 。 

因此 KMP 过 程 如 下 : 视频 讲解 




















i=0s j=05 
while (s 和 + 都 没有 扫描 完 ) 
{ ”让 OG= 一 1 或 者 它们 所 指 的 字符 相同 ) 
i 和 j 分别 增 1; 
else 


i 不 变 ,j 回 退 到 j= nextD]( 即 模式 串 右 滑 ); 


} 
让 GG 超 界 ) 返回 i 一 t 的 长 度 ; // 模 式 匹配 成 功 
else 返回 一 1; // 模 式 匹配 失败 





对 应 的 KMP 算法 如 下 : 


int KMPIndex(SqString s, SqString t) //KMP 算法 
{ int next[MaxSize],i=0,j=0; 

GetNext(t, next); 

while (i< s.length &&. j<t.length) 


{ ifG==—1 | s.data[i] ==t.data0]) 
eh 
Se //i\j 各 增 1 
} 
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else j 一 next[D] ; 
} 
if (>=t.length) 
return(i—t. length); 
else 
return(—1); 


Wi 不 变 ,j 后退 


// 匹 配 成 功 

// 返 回 子 串 位 置 
// 匹 配 不 成 功 
// 返 回 一 1 





} 


设 主 串 s 的 长 度 为 n, 子 串 4 的 长 度 为 m ,在 KMP 算法 中 求 next 数组 的 时 间 复 杂 度 为 
Olm) ,在 后 面 的 匹配 中 因 目 标 串 ;的 下 标 i 不 减 ( 即 不 回溯 ) ,比较 次 数 可 记 为 nn, 所 以 KMP 
算法 的 平均 时 间 复 杂 度 为 O(n 十 m) , 优 于 BF 算法 。 但 并 不 等 于 说 任何 情况 下 KMP 算法 
都 优 于 BF 算法 , 当 模式 串 的 next 数组 中 next[0] 二 一 1, 而 其 他 元 素 值 均 为 0 时 ,KMP 算 
法 退化 为 BF 算法 。 

【 例 4.5】 设 目标 串 ;二 "aaaaab" ,模式 串 :一 "aaab" ,给 出 KMP 进行 模式 匹配 的 过 程 。 

模式 串 1 对 应 的 next 数组 如 表 4. 1 所 示 , 采 用 KMP 算法 的 模式 匹配 过 程 如 图 4. 12 
所 示 。 首 先 用 ij 分 别 扫描 s 和 4 (初始 时 i 二 0,j 二 0) , 若 当前 比较 的 字符 相同 则 均 增 1, 比 
较 到 i 二 3,j 二 3 失败 为 止 ; i 值 不 变 (不 回溯 到 前 面 ) ,修改 j 二 next[3]==2; 下 一 趟 从 ;一 
3/j 二 2 开始 比较 ,这 之 后 所 有 字符 均 相 同 ,i\、j 递增 到 1 扫描 完毕 ,此 时 i 二 6,j 二 4, 返 回 
i 一 4. length 二 2, 表 示 1 是; 的 子 串 , 且 位 置 为 2, 总 共 需 要 8 次 字符 比较 (恰好 为 字符 间 纵 向 
连接 线条 数 )。 

















g | 
第 1 趟 匹配 jib jm 
(从 150, 产 0 开始 ) 和 人 7 失败 ， 修 改 为 i 不 变 
i j=3 人 人 人， jnext[3]=2 
4 
计 

第 2 趟 匹配 s:aaaaab i=6 
(从 i=3,j=2 开始 ) | | | | 成 功 ， 返 回 六 :length=2 

1: aaab i 

人 
图 4.12 KMP 算法 的 模式 匹配 过 程 





3 改进 的 NP 算法 

上 述 KMP 算法 中 定义 的 next 数组 仍然 存在 缺陷 。 例 如 设 目标 串 s 
为 "aaabaaaab" ,模式 串 1 为 "aaaab" ,模式 串 z 对 应 的 next 数组 如 表 4. 2 
所 示 。 














表 4.2 模式 串 上 的 next 数组 值 














i 0 h 2 3 4 
tj] a a a a b 
next[j] = 0 1 2 3 





这 两 个 串 匹 配 的 过 程 如 图 4. 13 所 示 , 从 中 可 以 看 到 , 当 达 3/ 一 3 时 ,ss 天 6 ,由 mnext[ 门 可 
知 还 需要 进行 i 二 3/j 二 2,i 二 3/j 二 1,i 二 3/j 二 0 的 3 次 比较 ,总 共 需 要 12 次 字符 比较 。 
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实际 上 ,因为 模式 串 1 中 的 too 字符 和 4s 字符 都 相等 ,所 以 不 需要 再 和 目标 串 中 的 
ss 进行 比较 ,可 以 将 模式 一 次 向 右 滑动 4 个 字符 的 位 置 , 即 直接 进行 ;==4/j 二 0 的 字符 比 


较 ,对 应 图 4.13(a) 和 (f) ,总 共 需 要 9 次 字符 比较 。 
43 
目标 串 : pe 失败 3 
模式 申 : aaaab 修改 为 J=next[]=2 
We 
(a) 第 1 趟 匹配 
153 
目标 申 : aaabaaaab 失败 本 
模式 申 : aaaab 修改 为 ”人 "extDF1 


2 
(b) 第 2 趟 匹配 


453 
目标 串 ， aaabaaaab 


失败 i=3 
模式 申 : aaaab 修改 为 j=next[]=0 


tie 
(0) 第 3 趟 开本 


153 
祭 串 : 
目标 串 : aaabaaaab 失败 村 棋 设 为 。 SRS4 
模式 申 : aaaab 修改 为 /=nextU]=-1 Ji+1-0 
hjo 


(d) 第 4 趟 匹配 
49 


目标 串 : aaabaaaab 
| 
aaaab 


模式 串 : hs 
(e) 第 5 趟 匹配 ， 返 回 六 :length=4 


图 4.13 KMP 算法 的 模式 匹配 过 程 
这 就 是 说 , 若 按 前 面 的 定义 得 到 next[ 门 二 ,在 模式 串 中 有 二 4, 当 目标 串 中 的 字符 s; 


和 模式 串 中 的 字符 4; 比较 不 相同 时 ,s; 一 定 和 zw 也 不 相同 ,所 以 没有 必要 再 将 s; 和 1 进行 
比较 ,而 是 直接 将 s; 和 zoewrn 进 行 比较 。 为 此 将 next[j] 修 正 为 nextval[j]。 





nextval 数组 的 定义 是 nextval[0j] 二 一 1, 当 4 二 tewrj 时 nextval[ 站 二 nextval[Lnext[jj], 否 则 ~ 


nextval[j ]=next[j]。 
用 nextval 取代 next, 得 到 改进 的 KMP 算法 如 下 : 
void GetNextval(SqString t, int nextval[] ) // 由 模式 串 t 求 出 nextval 值 


{ intj=0,k=—1; 
mnextval[0] 一 一 1; 
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while (j<t.length) 
{ if(k==—1 | t.data0]==t.data[k]) 
t tk 人 tt 
if (t.dataD] !=t. data[k]) 
nextval[D] =k; 
else 
nextval[] =nextval[k] ; 
} 
else 
k=nextval[k] ; 
} 
} 
int KMPIndex1(SqString s, SqString +) // 改 进 后 的 KMP 算法 
{ int nextval[MaxSize] ,i=0,j=0; 
GetNextval(t, nextval) ; 
while (i< s.length && j<t.length) 


{ ifG==—1 || s.data[i] ==t.data0]) 
人 
i 总 六 
} 
else 
j=nextvalD] ; 


} 
if (>=t. length) 
return(i—t. length); 
else 
return(—1); 


与 改进 前 的 KMP 算法 一 样 ,本 算法 的 时 间 复 杂 度 也 是 O(n 十 m)。 

【 例 4.6】 设 目 标 串 *="abcaabbabcabaacbacba" ,模式 串 1 二 "abcabaa" ,计算 模式 串 7 
的 nextval 函数 值 , 并 给 出 利用 改进 KMP 算法 进行 模式 匹配 的 过 程 。 

模式 串 上 的 nextval 值 如 表 4. 3 所 示 。 


表 4.3 模式 串 上 的 nextval 函数 值 








j t[;] next[j] nextval[j;] 
0 a 一 = 
1 b 0 0 
2 e 0 0 
3 a 0 = 
4 b 1 0 
5 a 2 2 
6 a 1 1 





利用 改进 KMP 算法 的 匹配 过 程 如 图 4. 14 所 示 。 
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第 1 趟 匹配 CE i=4 失败 大 4 
| j=4 修改 为 、 庆 nextval[4]=0 
1t: abcabaa 
t 
1 | 
第 2 趟 匹配 s: abcaabbabcabaacbacba i6 失败 i56 
请 Ut 广 2 修改 为 产 nextval[2]-0 
第 3 趟 匹配 s: abcaabbabcabaacbacba i=6 失败 i=6 修改 为 二 i+1=7 
eng nd 
j=0 ”修改 为 ”三 nextval[0] 一 1 it130 
t: abcabaa 
1 
第 4 趟 匹配 s: abcaabbabcabaacbacba i514 
| i 成 功 ， 返 回 天 :length=7 
广 
1: abcabaa 
t 
图 4.14 KMP 算 法 的 匹配 过 程 
-了 : 
二 本章 小 结 一 < 一 
本 章 的 基本 学 习 要 点 如 下 : 





(1) 理解 串 和 一 般 线 性 表 之 间 的 差异 。 

(2) 掌握 在 顺序 串 上 和 链 串 上 实现 串 的 基本 运算 算法 设计 。 
(3) 掌握 串 的 简单 匹配 算法 ,理解 KMP 算法 的 高 效 匹配 过 程 。 
(4) 灵活 地 运用 串 这 种 数据 结构 解决 一 些 综合 应 用 问题 。 

















练习 题 4 一 一 一 


1. 串 是 一 种 特殊 的 线性 表 , 请 从 存储 和 运算 两 方面 分 析 它 的 特殊 之 处 。 

2. 为 什么 在 模式 匹配 中 BF 算法 是 有 回溯 算法 ,而 KMP 算法 是 无 回溯 算法 ? 

3. 在 KMP 算法 中 计算 模式 串 的 next 时 ,车 j= 二 0, 为 什么 要 置 next[0]== 一 1? 

4. KMP 算法 是 简单 模式 匹配 算法 的 改进 ,以 目标 串 * 王 "aabaaabc"、 模 式 串 :一 
"aaabc" 为 例 说 明 的 next 的 作用 。 

5. 给 出 以 下 模式 串 的 next 值 和 nextval 值 : 





(1) ababaa aa 


(2) abaabaab 

6. 设 目标 串 ;二 "abcaabbabcabaacbacba" ,模式 串 :一 "abcabaa" 。 

(1) 计算 模式 串 1 的 nextval 数组 。 

(2) 不 写 算法 ,给 出 利用 改进 的 KMP 算法 进行 模式 匹配 的 过 程 。 

(3) 总 共 进行 了 多 少 次 字符 比较 ? 

7. 有 两 个 顺序 串 sl1 和 2 ,设计 一 个 算法 求 顺序 串 s3, 该 串 中 的 字符 是 s1 和 s2 中 的 公 





数据 结构 教程 \ 目 GO 





共 字 符 ( 即 两 个 串 都 包含 的 字符 ) 。 

8. 采用 顺序 结构 存储 串 ,设计 一 个 实现 串通 配 符 匹 配 的 算法 pattern_index() ,其 中 的 通 
配 符 只 有 '?', 它 可 以 和 任何 一 个 字符 匹配 成 功 。 例 如 ,pattern_index("? re","there are") 返 
回 的 结果 是 2。 

9. 设计 一 个 算法 ,在 顺序 串 * 中 从 后 向 前 查找 子 串 1, 即 求 1 在 s 中 最 后 一 次 出 现 的 位 置 。 

10. 设计 一 个 算法 ,判断 一 个 字符 串 * 是 否 为 形 如 "序列 1@ 为 序列 2" 模式 的 字符 序列 ， 
其 中 序列 1 和 序列 2 都 不 含有 '@ ' 字 符 , 且 序列 2 是 序列 1 的 逆序 列 。 例 如 "a 十 5@b 十 a" 属 
于 该 模式 的 字符 序列 ,而 "1 十 3@3 一 1" 不 是 。 

11. 采用 顺序 结构 存储 串 ,设计 一 个 算法 求 串 * 中 出 现 的 第 一 个 最 长 重复 子 串 的 下 标 
和 长 度 。 

12. 用 带头 结 点 的 单 链表 表示 链 串 ,每 个 结 点 存放 一 个 字符 。 设 计 一 个 算法 ,将 链 捉 s 
中 所 有 值 为 x 的 字符 删除 。 要 求 算法 的 时 间 复 杂 度 均 为 O(n) 、 空 间 复杂 度 为 0(1)。 
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其 验 证 性 实验 

实验 题 1: 实现 顺序 串 的 各 种 基本 运算 的 算法 

目的 : 领会 顺序 串 存储 结构 和 掌握 顺序 串 中 的 各 种 基本 运算 算法 设计 。 

内 容 : 编写 一 个 程序 sqstring. cpp, 实 现 顺 序 串 的 各 种 基本 运算 ,并 在 此 基础 上 设计 一 
个 程序 exp4-1. cpp 完成 以 下 功能 。 

(1) 建立 串 ;二 "abcdefghefghijklmn" 和 串 1 一 "xyz"。 

(2) 输出 串 >。 

(3) 输出 串 s 的 长 度 。 

(4) 在 串 s 的 第 9 个 字符 位 置 插入 串 s1 而 产生 串 s2。 

(5) 输出 串 s2。 

(6) 删除 串 s 的 第 2 个 字符 开始 的 5 个 字符 而 产生 串 2 。 

(7) 输出 串 2 。 

(8) 将 串 s 的 第 2 个 字符 开始 的 5 个 字符 替换 成 串 s1 而 产生 串 2 。 

(9) 输出 串 s2。 

(10) 提取 串 ; 的 第 2 个 字符 开始 的 10 个 字符 而 产生 串 53。 

(11) 输出 串 3。 

(12) 将 串 *1 和 串 52 连接 起 来 而 产生 串 4。 

(13) 输出 串 s4。 


实验 题 2: 实现 链 串 的 各 种 基本 运算 的 算法 

目的 : 领会 链 串 存储 结构 和 掌握 链 串 中 的 各 种 基本 运算 算法 设计 。 

内 容 : 编写 一 个 程序 listring. cpp, 实 现 链 串 的 各 种 基本 运算 ,并 在 此 基础 上 设计 一 个 
程序 exp4-2. cpp 完成 以 下 功能 。 

(1) 建立 串 ;二 "abcdefghefghijklmn" 和 串 1 一"xyz"。 
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(2) 输出 串 >。 

(3) 输出 串 * 的 长 度 。 

(4) 在 串 s 的 第 9 个 字符 位 置 插入 串 s1 而 产生 串 52。 

(5) 输出 串 s2。 

(6) 删除 串 s 的 第 2 个 字符 开始 的 5 个 字符 而 产生 串 s2。 
(7) 输出 串 2 。 

(8) 将 串 s 的 第 2 个 字符 开始 的 5 个 字符 蔡 换 成 串 s1 而 产生 串 s2。 
(9) 输出 串 s2。 

(10) 提取 串 * 的 第 2 个 字符 开始 的 10 个 字符 而 产生 串 s3。 
(11) 输出 串 s3。 

(12) 将 串 s1 和 串 s2 连接 起 来 而 产生 串 s4。 

(13) 输出 串 s4。 


实验 题 3: 实现 顺序 串 的 各 种 模式 匹配 算法 

目的 : 掌握 串 的 模式 匹配 算法 ( 即 BF 和 KMP 算法 ) 设 计 。 

内 容 : 编写 一 个 程序 exp4-3. cpp, 实 现 顺序 串 的 各 种 模式 匹配 运算 ,并 在 此 基础 上 完成 
以 下 功能 。 

(1) 建立 目标 串 s 一 "abcabcdabcdeabcdefabcdefg" 和 模式 串 :一 "abcdeabcdefab'" 。 

(2) 采用 简单 匹配 算法 求 1 在 s 中 的 位 置 。 

(3) 由 模式 串 1 求 出 next 数组 值 和 nextval 数组 值 。 

(4) 采用 KMP 算法 求 1 在 s 中 的 位 置 。 

(5) 采用 改进 的 KMP 算法 求 1 在 s 中 的 位 置 。 
戎 设 计 性 实验 

实验 题 4: 文本 串 加 密 和 解密 程序 

目的 : 掌握 串 的 应 用 算法 设计 。 

内 容 : 一 个 文本 串 可 用 事先 给 定 的 字母 映射 表 进行 加 密 。 例 如 , 设 字母 映射 表 为 : 

abcdefghijklmnopqrstuvwxyz 

ngzqtcobmuhelkpdawxfyivrsj 
则 字符 串 "encrypt" 被 加 密 为 "tkzwsdf"。 编 写 一 个 程序 exp4-4. cpp, 将 输入 的 文本 串 加 密 
后 输出 ,然后 进行 解密 并 输出 。 


实验 题 5: 求 一 个 串 中 出 现 的 第 一 个 最 长 重复 子 串 

目的 : 掌握 串 的 模式 匹配 应 用 算法 设计 。 

内 容 : 采用 顺序 结构 存储 串 ,编写 一 个 程序 exp4-5. cpp, 利 用 简单 模式 匹配 方法 求 串 3 
中 出 现 的 第 一 个 最 长 重复 子 串 的 下 标 和 长 度 。 
从 综合 性 实验 

实验 题 6: 利用 KMP 算法 求 子 串 在 主 串 中 出 现 的 次 数 

目的 : 深入 掌握 KMP 算法 的 应 用 。 

内 容 : 编写 一 个 程序 exp4-6. cpp, 利 用 KMP 算法 求 子 串 1 在 主 串 s 中 出 现 的 次 数 ,并 
以 ;二 "aaabbdaabbde" ,二 "aabbd" 为 例 , 显 示 匹 配 过 程 。 





aa 





在 算法 设计 中 经 常 需要 用 递归 方法 求解 , 特别 是 后 面 的 树 和 二 
叉 树 、 图 、 查找 及 排序 等 章节 中 大 量 地 用 到 了 递归 算法 。 递归 是 计 
算 机 科学 中 的 一 个 重要 工具 , 很 多 程序 设计 语言 如 C/C++ ) 都 支持 
递归 程序 设计 。 

本 章 介绍 递归 的 定义 和 递归 算法 设计 方法 等 , 为 后 面 的 学 习 打 
下 基础 。 


PASS 这 归 


什么 是 递归 米 


511 递归 的 定义 

在 定义 一 个 过 程 或 函数 时 出 现 调用 本 过 程 或 本 函数 的 成 分 称 为 递归 (recursion)。 若 调 
用 自身 , 称 为 直接 递归 (direct recursion)。 若 过 程 或 函数 p 调用 过 程 或 函数 g, 而 g 又 调用 
户 , 称 为 间接 递归 (indirect recursion)。 在 算法 设计 中 ,任何 间接 递归 算法 都 可 以 转换 为 直 
接 递归 算法 来 实现 ,所 以 后 面 主要 讨论 直接 递归 。 

递归 不 仅 是 数学 中 的 一 个 重要 概念 ,也 是 计算 技术 中 的 重要 概念 之 一 。 在 计算 技术 中 ， 
与 递归 有 关 的 概念 有 递归 数列 、 递 归 过 程 .递归 算法 .递归 程序 和 递归 方法 等 。 

(1) 递归 数列 指 的 是 由 递归 关系 所 确定 的 数列 。 扫 -- 扫 

(2) 递归 过 程 指 的 是 直接 或 间接 调用 自身 的 过 程 。 

(3) 递归 算法 指 的 是 包含 递归 过 程 的 算法 。 

(4) 递归 程序 指 的 是 直接 或 间接 调用 自身 的 程序 。 回 字 内 丝竹 

(5) 递归 方法 指 的 是 一 种 在 有 限 步 骤 内 根据 特定 的 法 则 或 公式 对 一 个 视频 讲解 
或 多 个 前 面 的 元 素 进 行 运算 ,以 确定 一 系列 元 素 ( 如 数 或 函数 ) 的 方法 。 

如 果 一 个 递归 过 程 或 递归 函数 中 的 递归 调用 语句 是 最 后 一 条 执行 语句 , 则 称 这 种 递归 
调用 为 尾 递归 (tail recursion)。 

【 例 5. 1】 以 下 是 求 n1(n 为 正 整 数 ) 的 递归 函数 , 它 属 于 什么 类 型 的 递归 ? 

















int fun(int n) 


= // 语 句 1 
return(1); // 语 句 2 
else // 语 句 3 


return(fun(n 一 1) * n); // 语 句 4 
} 


在 函数 fun(n) 的 求解 过 程 中 调用 fun(n 一 1) (语句 4), 它 是 一 个 直接 递归 函数 ,又 
由 于 递归 调用 是 最 后 一 条 语句 ,所 以 它 又 属于 尾 递 归 。 

递归 算法 通常 把 一 个 大 的 复杂 问题 层 层 转化 为 一 个 或 多 个 与 原 问 题 相 似 的 规模 较 小 的 
问题 来 求解 ,递归 策略 只 需 少 量 的 代码 就 可 以 描述 出 解 题 过 程 中 所 需要 的 多 次 重复 计算 ,大 
大 减少 了 算法 的 代码 量 。 





一 般 来 说 ,能 够 用 递归 解决 的 问题 应 该 满足 以 下 3 个 条 件 ， ~ 


(1) 需要 解决 的 问题 可 以 转化 为 一 个 或 多 个 子 问 题 来 求解 ,而 这 些 子 问题 的 求解 方法 
与 原 问 题 完 全 相同 ,只 是 在 数量 规模 上 不 同 ; 

(2) 递归 调用 的 次 数 必须 是 有 限 的 ; 

(3) 必须 有 结束 递归 的 条 件 来 终止 递归 。 

递归 算法 的 优点 是 结构 简单 清晰 ,易于 阅读 ,方便 其 正确 性 证 明 ; 缺点 是 算法 执行 中 
占用 的 内 存 空 间 较 多 ,执行 效率 低 ,不 容易 优化 。 
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512 何 时 使 用 递归 
在 以 下 3 种 情况 下 常常 要 用 到 递归 方法 。 
有 许多 数学 公式 数列 等 的 定义 是 递归 的 。 例 如 , 求 n!1 和 Fibonacci 数 视频 讲 引 
列 等 。 对 于 这 些 问 题 的 求解 可 以 将 其 递归 定义 直接 转化 为 对 应 的 递归 算法 。 例 如 , 求 n1 可 
以 转化 为 例 5. 1 的 递归 算法 。 求 Fibonacci 数列 的 递归 算法 如 下 : 

















int Fibl (int n) // 求 Fibonacci 数列 的 第 n 项 
{ if (n==1 | n==2) 
return(1); 
else 
return(Fibl(n—1)+Fibl(n—2)); 
} 


显然 ,上 述 递归 算法 属于 尾 递归 算法 。 


2 数据 络 稳 是 递 闻 的 
有 些 数据 结构 是 递归 的 。 例 如 第 2 章 中 介绍 的 单 链表 就 是 一 种 递归 数据 结构 ,其 结 点 
类 型 声明 如 下 : 


typedef struct LNode 


{ ElemType data; // 存 放 结 点 数据 
struct LNode * next; // 指 向 下 一 个 同类 型 结 点 的 指针 
) LinkNode; // 单 链表 的 结 点 类 型 


其 中 ,结构 体 LNode 的 声明 用 到 了 它 自身 , 即 指针 域 next 是 一 种 指向 自身 类 型 结 点 的 指 
针 , 所 以 它 是 一 种 递归 数据 结构 。 

对 于 递归 数据 结构 ,采用 递归 的 方法 编写 算法 既 方便 又 有 效 。 例 如 求 一 个 不 带头 结 点 
的 单 链表 工 的 所 有 data 域 (假设 为 int 型 ) 之 和 的 递归 算法 如 下 : 


int Sum(LinkNode * L) 
{ if(L==NULL) 
return 0; 
else 
Teturn(L 一 > data 十 Sum(L 一 > next)); 


} 


有 些 问题 的 解法 是 递归 的 , 奥 型 的 有 Hanoi 问题 求解 ,该 问题 的 描述 是 , 设 有 3 个 分 别 
命名 为 X.Y 和 2Z 的 塔 座 ,在 塔 座 X 上 有 个 直径 各 不 相同 的 盘 片 ,从 小 到 大 依次 编号 为 1 、 
2、… wz。 现 要 求 将 XX 塔 座 上 的 这 个 盘 片 移 到 塔 座 2 上 并 仍 按 同 样 的 顺序 本 放 , 移 片 移动 
时 必须 遵守 以 下 规则 : 每 次 只 能 移动 一 个 盘 片 ; 盘 片 可 以 插 在 X\Y 和 Z 中 的 任 一 塔 座 ; 任 
何 时 候 都 不 能 将 一 个 较 大 的 盘 片 放 在 较 小 的 和 片上 。 图 5. 1 所 示 为 4 一 4 的 Hanoi 问题 。 


@08 





设计 求解 该 问题 的 算法 。 


持 || 一 | 后 


xX 了 2 








图 5.1 Hanoi 问 题 (n==4) 


Hanoi 问题 特别 适合 采用 递归 方法 来 求解 。 设 Hanoi(n,zx,y,z) 表 示 将 个 盘 片 从 工 
塔 座 借助 y 塔 座 移动 到 x 塔 座 上 ,递归 分 解 的 过 程 如 下 : 
Hanoi(n-l, x, 2, »); 
Hanoi(n, x, yz) | 一 一 > | move(n, x，z): 将 第 个 圆 盘 从 x 移 到 z=; 
Hanoi(n-l, y, x, z) 
其 含义 是 首先 将 z 塔 座 上 的 一 1 个 盘 片 借助 = 塔 座 移动 到 y 塔 座 上 ; 此 时 工 塔 座 上 
只 有 一 个 盘 片 ,将 其 直接 移动 到 > 塔 座 上 ; 再 将 y 塔 座 上 的 一 1 个 盘 片 借助 x 塔 座 移动 到 
z 塔 座 上 。 由 此 得 到 Hanoil 递归 算法 如 下 : 





























void Hanoil(int n, char X, char Y, char Z) 


‘ly // 只 有 一 个 盘 片 的 情况 
printf("\t 将 第 %d 个 盘 片 从 %c 移 动 到 %c\n",n,X,2); 
else // 有 两 个 或 多 个 盘 片 的 情况 


{ Hanoil(n—1,X,2Z,Y); 
printf("\t 将 第 %d 个 盘 片 从 %c 移动 到 %c\n",n,X,2); 
Hanoil(n—1,Y,X,2); 


} 


设 Hanoi(n,zt,y,z) 的 执行 时 间 为 T(n) ,由 Hanoil 递归 算法 得 到 以 下 递 推 式 : 
T(n)=1 当 n=1 时 

Tn)=2T(n—1)+1 当 一 1 时 

则 : T()==2T(n 一 了) 十 1=2(2T(n 一 2) 十 1) 十 1 

2:T(n 一 2) 十 2 十 1 二 2:(2T(n 一 3) 填 1) 十 2 十 1 
TT(n=3) 丰 类 二 2 寺 1 




















一 2"-1T(D) 十 2" 一 十 … 十 22 十 2 十 1 
=2"—1=0(2") 


513 递归 模型 


递归 模型 是 递归 算法 的 抽象 , 它 反映 一 个 递归 问题 的 递归 结构 ,例如 , 例 5.1 的 递归 算 
法 对 应 的 递归 模型 如 下 : 


Fm Wl 
fn)=nx* f(n—1) n>1 


149 











数据 结构 教程 \ 目 GO 





其 中 ,第 一 个 式 子 给 出 了 递归 的 终止 条 件 , 第 二 个 式 子 给 出 了 f(n) 的 值 与 f(n 一 1) 的 值 之 
间 的 关系 ,把 第 一 个 式 子 称 为 递归 出 口 ,把 第 二 个 式 子 称 为 递归 体 。 

一 般 情况 下 ,一 个 递归 模型 由 递归 出 口 和 递归 体 两 部 分 组 成 。 递 归 出 口 (recursive 
exit) 确 定 递归 到 何 时 结束 , 即 指出 明确 的 递归 结束 条 件 。 递 归 体 (recursive body) 确 定 递归 
求解 时 的 递 推 关 系 。 

递归 出 口 的 一 般 格式 如 下 : 

JGs) 三 ma (5. 1) 

这 里 的 5 与 ma 均 为 常量 ,有 些 递归 问题 可 能 有 几 个 递归 出 口 。 递归 
体 的 一 般 格式 如 下 : 

FS = mn 5. 2) 
其 中 ,nvi、j、m 均 为 正 整 数 。 这 里 的 w 是 一 个 递归 “大 问题 ”si ,s+ ,… ,ss-1 为 递归 “小 问 
题 ”,cj ,ci+l,…，cn 是 若干 个 可 以 直接 (用 非 递归 方法 ) 解 决 的 问题 ,g 是 一 个 非 递 归 函 数 ,可 
以 直接 求 值 。 

















视频 讲解 


实际 上 ,递归 思路 是 把 一 个 不 能 或 不 好 直接 
求解 的 “大 问题 "转化 成 一 个 或 几 个 “小 问题 "来 解 
决 ,如 图 5.2 所 示 , 再 把 这 些 “ 小 问题 ”进一步 分 解 











- 成 更 小 的 “小 问题 "来 解决 ,如 此 分 解 ,直到 每 个 
Lmw | Le | 和 Le | “小 问题 "都 可 以 直接 解决 (此 时 分 解 到 递归 出 
图 5.2 把 大 问题 f(s,) 转 化 成 几 个 。”“” 口 )。 但 递归 分 解 不 是 随意 的 分 解 ,递归 分 解 要 保 
小 问题 来 解决 证 “大 问题 "与 “小 问题 "相似 , 即 求解 过 程 与 环境 
都 相似 。 
为 了 讨论 方便 , 设 简化 的 递归 模型 (即将 一 个 “大 问题 "分 解 为 一 个 “小 问题 ”) 如 下 : 
f(5)=m (563 
Cs = gf C501) ,ca1) (5.4) 
在 求 /(s,) 时 的 分 解 过 程 如 下 : 
Fwy 
+ 
+ 
f(s2) 
+ 
CS) 


一 旦 遇 到 递归 出 口 ,分 解 过 程 结束 ,开始 求 值 过 程 ,所 以 分 解 过 程 是 “量变 "过程 , 即 原来 
的 “大 问题 "在 慢 慢 变 小 ,但 尚未 解决 , 遇 到 递归 出 口 后 便 发 生 了 “质变 ”, 即 原 递归 问题 便 转 
化 成 直接 问题 。 上 面 的 求 值 过 程 如 下 : 


150 


ASS 这 有 





f(s1)=m 
Y 
f(s2)=g(f(s1),c) 
YY 
f(s3)=g(f(ss) ,cs) 
M 


y 
f(s.)=g(f(s.-1) ,cs.-1) 
这 样 f(s,) 便 计算 出 来 了 。 因 此 ,递归 的 执行 过 程 由 分 解 和 求 值 两 部 分 构成 ,分 解 部 分 
就 是 用 递归 体 将 “大 问题 "分 解 成 “小 问题 ", 直 到 递归 出 口 为 止 ,然后 进行 求 值 过 程 , 即 已 知 
“小 问题 ”计算 “大 问题 ”。 前 面 的 fun(5) 的 求解 过 程 如 图 5. 3 所 示 。 







fun(5) fun(5)=120 
fun(4) fun(4)=2 
fun(3)=6 


pA 


fun(2)=2 





图 5.3 fun(5) 的 求 值 过 程 


在 递归 算法 执行 中 最 长 的 递归 调用 的 链 长 称 为 该 算法 的 递归 调用 深度 。 例 如 求 n! 对 
应 的 递归 算法 在 求 fun(5) 时 递归 调用 深度 是 5。 

对 于 复杂 的 递归 算法 ,其 执行 过 程 可 能 需要 循环 反复 的 分 解 和 求 值 才能 获得 最 终 解 。 
例如 ,对 于 前 面 求 Fibonacci 数列 的 Fibl 算法 , 求 Fib1(6) 的 过 程 构成 的 递归 树 如 图 5.4 所 













Fib1(5) Fib1(4) |3 




















2 Fib1(3) |2 Fiblo)] 


二 2 Be 1 
2 ~ Fib1(2) | | Fib1(2) Fib1(1) | | Fib1(2) Fib1(1) 
Se 1 1 1 1 1 

” \ 


FiblC) |1 | Fibl() |1 

































































图 5.4 求 Fib(6) 对 应 的 递归 树 
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示 , 向 下 的 实 箭头 表示 分 解 ,向 上 的 虚 箭 头 表 示 求 值 ,每 个 方 框 劳 边 的 数字 是 该 方 框 的 求 值 
结果 ,最 后 求 得 Fib1(6) 为 8。 该 递归 树 的 高 度 为 5, 所 以 递归 调用 深度 也 是 5。 


514 递归 与 数学 归纳 法 
从 递归 体 可 以 看 到 ,如 果 已 知 5 ,50404,… ,ss-1, 就 可 以 确定 s,。 从 数学 
归纳 法 的 角度 来 看 ,这 相当 于 数学 归纳 法 归纳 步骤 的 内 容 。 但 仅 有 这 个 关 


系 还 不 能 确定 这 个 数列 , 若 使 它 完全 确定 ,还 应 给 出 这 个 数列 的 初始 值 ' 。 
例如 ,采用 数学 归纳 法 证 明 下 式 : 


1 十 2 十 … 十 一 




















n(n 二 +1) 
2 





当 n==1 时 , 左 式 =1, 右 式 1, 左 、 右 两 式 相 等 ,等 式 成 立 。 


假设 当 一 A 一 1 时 等 式 成 立 , 有 1 十 2 十 …… 十 (ED 一 和 全 





1X2 
2 


RCR 一 1) 
2 








当 n==k 时 , 左 式 ==1 十 2 十 … 十 k= 二 1 十 2 十 … 十 (k 一 1) 十 k 


等 式 成 立 。 即 证 。 
数学 归纳 法 是 一 种 论证 方法 ,而 递归 是 算法 和 程序 设计 的 一 种 实现 技术 ,数学 归纳 法 是 
递归 求解 问题 的 理论 基础 。 可 以 说 递归 的 思想 来 自 数学 归纳 法 。 


栈 和 递归 。 


BE 





_k(k+1) 
2 





521 函数 调用 栈 


函数 调用 操作 包括 从 一 块 代码 到 另 一 块 代码 之 间 的 双向 数据 传递 和 执 
行 控制 转移 。 数 据 传递 通过 函数 参数 和 返回 值 实现 ,另外 还 需要 在 进入 函 
数 时 为 函数 的 局 部 变量 分 配 存储 空间 ,并 且 在 退出 函数 时 收回 这 部 分 空间 。 

大 多 数 CPU 上 的 程序 实现 使 用 栈 来 支持 函数 调用 操作 。 单 个 函数 调用 操作 所 使 用 的 
函数 调用 栈 被 称 为 栈 帧 (stack frame) 结 构 。 每 次 函数 调用 时 都 会 相应 地 创建 一 帧 ,保存 返 
回 地 址 、 函 数 实 参 和 局 部 变量 值 等 ,并 将 该 帧 压 人 调用 栈 。 若 在 该 函数 返回 之 前 又 发 生 了 新 
的 调用 , 则 同样 要 将 与 新 函数 对 应 的 一 帧 进 栈 .成 为 栈 项 。 函 数 一 旦 执行 完毕 ,对 应 的 帧 便 
出 本 ,控制 权 交 还 给 该 函数 的 上 层 调用 函数 .并 按照 该 帧 中 保存 的 返回 地 址 确定 程序 中 继续 
执行 的 位 置 。 

例如 ,车 有 以 下 程序 : 














视频 讲解 


int main() 
{ int m,n; 


fm,n); // 后 面 第 一 个 语句 的 地 址 为 dl 
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return 1; 
} 
void f(int s,int t) 
int i; 


gD); // 后 面 第 一 个 语句 的 地 址 为 d2 
} 


void g(int d) 
int x,y; 


} 


在 执行 上 述 程序 时 ,假设 main 函数 的 返回 地 址 为 de 。 当 执行 main 函数 时 ,将 栈 帧 
进 栈 。 在 main 函数 中 调用 /函数 时 ,将 栈 帧 四 进 栈 。 在 f 函数 中 调用 g 函数 时 ,将 栈 帧 @ 
进 栈 ,如 图 5.5 所 示 。 当 g 函数 执行 完毕 ,将 栈 帧 回 退 栈 , 控 制 权 交 回 到 了 函数 ,转向 其 中 
的 ds 地 址 继续 执行 ,其 余 执行 过 程 类 似 。 























栈 顶 中 i x，y | 栈 帧 9) 
di m,n 1 栈 帧 @@ 
dh m,n “| 栈 帧 D 
返回 地 址 实 参 局 部 变量 
图 5.5 函数 调用 栈 


522 递归 调用 的 实现 


递归 是 函数 调用 的 一 种 特殊 情况 , 即 它 是 调用 自身 代码 。 因 此 ,也 可 以 把 每 一 次 递归 调 
用 理解 成 调用 自身 代码 的 一 个 复制 件 。 由 于 每 次 调用 时 , 它 的 参数 和 局 部 变量 可 能 不 相同 ， 
因而 也 就 保证 了 各 个 复制 件 执行 时 的 独立 性 。 

但 这 些 调用 在 内 部 实现 时 并 不 是 每 次 调用 真正 去 复制 一 个 复制 件 存放 到 内 存 中 ,而 是 
采用 代码 共享 的 方式 ,也 就 是 它们 都 是 调用 同一 个 函数 的 代码 ,系统 为 每 一 次 调用 开辟 一 组 
存储 单元 ,用 来 存放 本 次 调用 的 返回 地 址 以 及 被 中 断 的 函数 的 参数 值 。 这 
些 单元 以 栈 的 形式 存放 ,每 调用 一 次 进 栈 一 次 , 当 返 回 时 执行 出 栈 操作 ,把 
当前 栈 顶 保留 的 值 送 回 相应 的 参数 中 进行 恢复 ,并 按 栈 顶 中 的 返回 地 址 从 
断 点 继续 执行 。 下 面 通过 计算 fun(5) 的 值 介绍 递归 调用 过 程 实现 的 内 部 
机 理 。 

表 5.1 给 出 了 求解 fun(5) 的 递归 调用 过 程 中 程序 的 执行 及 栈 的 变化 情 。。 于 
况 , 设 调用 fun(5) 的 返回 地 址 为 do 。 

在 调用 fun(5) 时 , 先 把 返回 地 址 d 以 及 参数 5 进 栈 ,然后 执行 语句 1、3、4, 当 遇 到 其 中 
的 fun(5-1)( 即 fun(4)) 时 ,必须 中 断 当 前 执行 的 程序 , 转 去 调用 fun(4) ,记录 下 其 返回 地 址 
为 di; 在 调用 fun(4) 时 , 先 把 返回 地 址 di 以 及 参数 4 进 栈 ,然后 执行 语句 1、3、4, 当 遇 到 其 
中 的 fun(3) 时 转 去 调用 fun(3) ,记录 下 其 返回 地 址 为 ds ; …。 一 直到 调用 fun(1), 把 返回 
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地 址 ds 以 及 参数 1 进 栈 。 
表 5.1 fun(5) 的 执行 过 程 










































































































































































| 栈 内 情况 a 
序号 调用 /执行 | 返回 地 址 进 /出 栈 返回 地 址 实 参 执行 语句 说 明 
1 调用 fun(5) | do 进 栈 do 5 1,3,4 
di 4 
区 调用 fun(4) | di 进 栈 1,3,4 
do 5 
d: 3 
3 调用 fun(3) | d; 进 栈 di 4 1,3,4 
do 5 
ds 2 
4 调用 fun(2) | ds 进 栈 a 有 L854 
di 4 
do 5 
ds 1 
ds 有 
5 调用 fun(1) | d 进 栈 地 3 1,3,4 
di 4 
do 5 
ds 2 
i i d; 3 
6 执行 fun(1) | 返回 ds 出 栈 a 3 1,2 求 得 fun(1)=1 
» 
do 5 
ds; 3 
7 执行 fun(2) | 返回 ds 出 栈 di 4 4 求 得 fun(2) 一 2 
do 5 
一 y di 4 
8 执行 fun(3) | 返回 ds 出 栈 3 E 4 求 得 fun(3)=6 
9 执行 fun(4) | 返回 出 栈 do 5 4 求 得 fun(4) 一 24 
10 执行 fun(5) | 返回 w 栈 空 4 求 得 fun(5) 二 120 





然后 执行 fun(1) ,执行 语句 1.2, 返 回 1 并 出 栈 一 次 ; 执行 fun(2) ,执行 语句 4, 返回 2 
并 出 栈 一 次 ; …。 一 直到 执行 fun(5) ,此 时 栈 空 ,返回 120 并 转向 do 。 
例如 ,已 知 程序 如 下 : 


int S(int n) 
{ return (n<=0) ?0 : SC(n—1)+n;} 
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int main() 
{ printf("%dNn" ,SC1)); 
return 1; 


} 


程序 执行 时 使 用 一 个 栈 来 保存 调用 过 程 的 信息 ,这 些 信息 用 main()、S(0) 和 S(1) 表 
示 ,那么 自 栈 底 到 栈 顶 保存 的 信息 的 顺序 是 怎么 样 的 ? 

首先 从 main() 开 始 执行 程序 ,将 main() 信 息 进 栈 , 遇 到 调用 SG1) ,将 S(1) 信 息 进 栈 ,在 
执行 递归 函数 SC1) 时 又 遇 到 调用 S(0) ,再 将 SC0) 信 息 进 栈 。 所 以 , 自 栈 底 到 栈 顶 保存 的 信 
息 的 顺序 是 main 〇 一 S(1) 一 S(0)。 扫 - 扫 


523 递归 到 非 递 归 的 转换 


一 般 情况 下 , 尾 递归 算法 可 以 通过 循环 或 者 迭代 方式 转换 为 等 价 的 非 
递归 算法 。 例 如 ,前 面 求 Fibonacci 数列 的 递归 算法 Fibl 可 以 转换 如 下 : 视频 讲解 

















int Fib2(int n) // 求 Fibonacci 数列 的 第 n 项 
{ int a 一 1,b 一 1,i,s; 
ER 王 三 划 | 三 三 2 
return(1); 
else 
{ for (i=3;i<=n;ii+) 
{ s 一 a 十 b; 
a=b; 
b=s; 
} 
Teturn s; 
} 
} 


对 于 不 是 尾 递归 的 复杂 递归 算法 ,在 理解 递归 调用 实现 过 程 的 基础 上 可 以 用 栈 来 模拟 
递归 执行 过 程 ,从 而 将 其 转换 为 等 价 的 非 递归 算法 。 

例如 ,在 将 前 面 求解 Hanoi 问题 的 递归 算法 Hanoil 转换 为 等 价 的 非 递 归 算 法 时 ,需要 
使 用 一 个 栈 暂 时 存放 还 不 能 直接 移动 盘 片 的 任务 / 子 任务 。 

首先 将 任务 Hanoi(z,zyy,z) 进 栈 , 栈 不 空 循环 : 出 栈 一 个 任务 Hanoi(n,z,y,x) ,如果 
它 是 可 直接 移动 的 ,就 移动 盘 片 ; 否则 该 任务 转化 为 Hanoi(n 一 1,z,z,y)、move(n,x,z)、 
Hanoi(Cn 一 1.y,z,x), 按 相反 顺序 (即将 3 个 任务 Hanoi(n 一 1.y,z,z)、move(Czzyx) 和 
Hanoi(n 一 1,z,z,y)) 依 次 进 栈 , 其 中 move(n,z,zx) 是 可 直接 移动 的 任务 。 为 此 ,设计 一 个 
顺序 栈 的 类 型 如 下 : 


typedef struct 


和 // 盘 片 个 数 

char x,y,2; //3 个 塔 座 

bool flag; // 可 直接 移动 盘 片 时 为 true, 否则 为 false 
} ElemType; // 顺 序 栈 中 元 素 的 类 型 


typedef struct 
{ ”ElemType data[MaxSize];  // 存 放 元 素 
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int top; // 栈 项 指针 
} StackType; // 顺 序 栈 的 类 型 


栈 中 的 每 个 元 素 对 应 一 个 求解 任务 ,flag 标识 该 任务 是 否 可 以 直接 移动 盘 片 。 采 用 第 
3 章 的 原理 设计 好 顺序 栈 的 基本 运算 算法 (除了 将 SqStack 改 为 StackType 以 外 ,其 他 代码 
都 是 相同 的 )。 对 应 的 求解 Hanoi 问题 的 非 递归 算法 如 下 : 


void Hanoi2(int n, char x, char y, char z) 


























{ StackType * st; // 定 义 顺序 栈 指针 
ElemType e,el,e2,e3; 
if (n<=0) return; // 参 数 错误 时 直接 返回 
TInitStack( st) ; // 初 始 化 栈 
€. n=n; e.x=x; e.y 一 yi e.z=z; e.flag=false; 
Push(st, e); // 元 素 e 进 栈 
while (!StackEmpty(st)) // 栈 不 空 循环 
{ Pop(st,e); // 出 栈 元 素 e 
if (e.flag 一 一 false) // 当 不 能 直接 移动 盘 片 时 
{ el.n=e.n—l1; el.x=e.y; el.y=e.x; el.z=e.2; 
if (el.n==1) // 只 有 一 个 盘 片 时 可 直接 移动 
el.flag= true; 
else // 有 一 个 以 上 盘 片 时 不 能 直接 移动 
el.flag=false; 
Push(st, el); // 处 理 Hanoi(n 一 1,y,x,z) 步 又 
e2.n 一 e.n; e2.x=e.x; e2.y=e.y; e2.z 一 e.z; e2.flag 一 true; 
Push(st, e2); // 处 理 move(Cn,x,z) 步 又 
e3.n=e.n—l1; e3.x=e,x; e3.y=e.2; e3.z 一 e.7; 
if (e3.n==1) // 只 有 一 个 盘 片 时 可 直接 移动 
e€3.flag= true; 
else 
e3. flag= false; // 有 一 个 以 上 盘 片 时 不 能 直接 移动 
Push(st, e3); // 处 理 Hanoi(n 一 1,x,z,y) 步 又 
} 
else // 当 可 以 直接 移动 时 


printf("\t 将 第 %d 个 盘 片 从 %c 移动 到 %c\n",e.n,e.x,e.z); 
} 
DestroyStack( st); // 销 毁 栈 


递归 算法 的 设计 兴 


531 递归 算法 设计 的 步骤 

递归 算法 设计 的 基本 步骤 是 先 确定 求解 问题 的 递归 模型 ,再 转换 成 对 应 的 C/C++ 语言 
函数 。 由 于 递归 模型 反映 递归 问题 的 “本质 ,所 以 前 一 步 是 关键 ,也 是 讨论 的 重点 。 

递归 算法 的 求解 过 程 是 先 将 整个 问题 划分 为 若干 个 子 问题 ,然后 分 别 求解 子 问题 ,最 后 
获得 整个 问题 的 解 。 这 是 一 种 分 而 治之 的 思路 ,通常 由 整个 问题 划分 的 若干 子 问题 的 求解 
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是 独立 的 ,所 以 求解 过 程 对 应 一 棵 递归 树 。 如 果 在 设计 算法 时 就 考虑 递归 树 中 的 每 一 个 分 
解 / 求 值 部 分 会 使 问题 复杂 化 ,不 妨 只 考虑 递归 树 中 第 1 层 和 第 2 层 之 间 的 关系 , 即 “ 大 问 
题 ” 和 * 小 问题 ”的 关系 ,其 他 关系 与 之 相似 。 扫 -- 扫 
由 此 得 出 获取 求解 问题 递归 模型 (简化 递归 模型 ) 的 步骤 如 下 : 回 
(1) 对 原 问题 /(s,) 进 行 分 析 ,假设 出 合理 的 小 问题 Cs _; ) 。 
(2) 假设 小 问题 /(5, -1 ) 是 可 解 的 ,在 此 基础 上 确定 大 问题 /Cs ) 的 解 ， | 加 : 
即 给 出 f(s,) 与 f(5,-1) 之 间 的 关系 ,也 就 是 确定 递归 体 (与 数学 归纳 法 中 假 视频 讲解 
设 ;一 "一 1 时 等 式 成 立 , 再 求证 ;一 时 等 式 成 立 的 过 程 相似 ) 。 
(3) 确定 一 个 特定 情况 (如 /(1) 或 /(0)) 的 解 , 由 此 作为 递归 出 口 (与 数学 归纳 法 中 求 
证 i=1 或 ;一 0 时 等 式 成 立 相似 )。 
【 例 5.2】 采用 递归 算法 求实 数 数组 A[0..n 一 1] 中 的 最 小 值 。 
假设 /(A, 站 求 数组 元 素 A[0.. 门 ( 共 i 十 1 个 元 素 ) 中 的 最 小 值 。 当 i=0 时 ,有 
(A, 站 = 二 AL0j; 假设 f(A,i 一 1) 已 求 出 ,显然 有 f(A, 让 二 MIN(f(A,i 一 1),A[ 门 ), 其 中 
MINO 〇 为 求 两 个 值 中 较 小 值 的 函数 。 因 此 得 到 以 下 递归 模型 : 
A[0] 当 i 一 0 时 
f(A,i) = 
MIN(f(A,i 一 1),A[ 门 ) 其 他 情况 
由 此 得 到 以 下 递归 求解 算法 : 
























double Min(double A[],int ) 
{ double min; 
if (i==0) return A[0]; 
else 
{ min=Min(A,i—1); 
if (min> A[i]) return( A[]); 
else returnCmin) ; 


} 


例如 , 若 一 个 实数 数组 为 double a[ ] 二 {9.2,5.5,3.8,7.1,6.5), 调 用 Min(a,4) 返 回 最 
小 元 素 3. 8。 

【 例 5.3】 求 顺序 表 (a ,as,… ,a, ) 中 的 最 大 元 素 。 

将 顺序 表 分 解 成 (al ,az ,…:an)( 左 子 表 ) 和 (an+i,…,ay)( 右 子 表 ) 两 个 子 表 ,分 别 
求 出 子 表 中 的 最 大 元 素 a; 和 oj ,比较 w 和 ai 中 的 大 者 ,就 可 以 求 得 整个 顺序 表 的 最 大 元 





素 。 求 解 子 表 中 的 最 大 元 素 的 方法 与 总 表 相 同 , 即 再 将 它们 分 成 两 个 更 小 的 子 表 ,如 此 不 断 aa 


分 解 ,直到 表 中 只 有 一 个 元 素 为 止 ( 当 只 有 一 个 元 素 时 ,该 元 素 便 是 该 表 的 最 大 元 素 ) 。 对 应 
的 递归 算法 如 下 : 


ElemType Max(SqList L,int i,int j) // 求 顺序 表 L 中 的 最 大 元 素 
{ int mid; 
ElemType max,maxl ,max2; 
if (i==)) // 顺 序 表 中 只 有 一 个 元 素 , 即 递归 出 口 
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max=L. data[i] ; // 该 元 素 就 是 最 大 元 素 

else // 顺 序 表 中 有 多 个 元 素 

{ mid 一 (i 十 j)/2; // 求 中 间 位 置 
maxl 一 Max(L,imid); // 递 归 调用 求 左 子 表 中 的 最 大 元 素 maxl 
max2 一 Max(L,mid 十 1,j); // 递 归 调 用 求 右 子 表 中 的 最 大 元 素 max2 


max 一 (maxl > max2)?maxl:max2; ”// 求 整个 表 的 最 大 元 素 max 
} 


return(max); 


532 基于 递归 数据 结构 的 递归 算法 设计 


具有 递归 特性 的 数据 结构 称 为 递归 数据 结构 。 递 归 数 据 结构 通常 是 采用 递归 方式 定义 
的 。 在 一 个 递归 数据 结构 中 总 会 包含 一 个 或 者 多 个 递归 运算 。 
例如 , 正 整数 的 定义 为 1 是 正 整数 ,若是 正 整 数 (n 三 1) , 则 十 1 也 是 正 整 数 。 从 中 可 
以 看 出 , 正 整数 就 是 一 种 递归 数据 结构 。 显 然 , 若 邓 是 正 整数 (xz 二 1) ,m= 二 nn 扫 -- 扫 
一 1 也 是 正 整数 ,也 就 是 说 ,对 于 大 于 1 的 正 整数 wx 一 1 是 一 种 递归 运算 。 
所 以 在 求 n! 的 算法 中 ,递归 体 (x) 二 nx* /ln 一 1) 是 可 行 的 ,因为 对 
于 大 于 1 的 n,n 和 nn 一 1 都 是 正 整数 。 tt 
一 般 情况 下 ,对 于 递归 数据 结构 视频 讲解 




















RD=(D, Op) 


其 中 ,D={d) (1i<n, 共 nn 个 元 素 ) 为 构成 该 数据 结构 的 所 有 元 素 的 集合 ,Op 是 递归 运算 
的 集合 ,Op 二 {op;} (1 二 j 和 m, 共 m 个 运算 )。 对 于 d;ED, 不 妨 设 op; 为 一 元 运算 符 , 则 有 
opj(di) ED, 也 就 是 说 ,递归 运算 具有 封闭 性 。 

在 上 述 正 整 数 的 定义 中 ,D 是 正 整数 的 集合 ,Op 二 {opi ,ops) 由 两 个 基本 递归 运算 符 构 
成 ,op; 的 定义 为 op (7n) 二 n 一 1(n1); ops 的 定义 为 op (7) 二 n 十 1(n 宇 1)。 

对 于 不 带头 结 点 的 单 链表 ,其 结 点 类 型 为 LinkNode, 每 个 结 点 的 next 域 为 LinkNode 
类 型 的 指针 ,这 样 的 单 链表 通过 首 结 点 指针 来 标识 。 采 用 递归 数据 结构 的 定义 如 下 : 


SL=(D, Op) 


其 中 ,D 是 由 部 分 或 全 部 结 点 构成 的 单 链表 的 集合 ( 含 空 单 链表 ) ,Op 二 {op1) ,op 的 定义 
如 下 : 


op (L)=L 一 next //L 为 含 一 个 或 一 个 以 上 结 点 的 单 链表 


显然 这 个 递归 运算 符 是 一 元 运算 符 , 且 具有 封闭 性 。 也 就 是 说 , 若 工 为 不 带头 结 点 的 
非 空 单 链表 , 则 工 一 > next 也 是 一 个 不 带头 结 点 的 单 链表 。 

实际 上 ,递归 算法 设计 步骤 中 的 第 2 步 是 用 于 确定 递归 模型 中 的 递归 体 。 在 假设 原 问 
题 /(s) 合 理 的 小 问题 f(s ) 时 ,需要 考虑 递归 数据 结构 的 递归 和 运算。 例如 ,在 设计 不 带头 结 
点 的 单 链表 的 递归 算法 时 ,通常 设 * 为 以 为 首 结 点 指针 的 整个 单 链表 ,s 为 除 首 结 点 以 外 
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余下 结 点 构成 的 单 链表 (由 工 一 > next 标识 ,而 该 运算 为 递归 运算 ) 。 
【 例 5.4】 假设 有 一 个 不 带头 结 点 的 单 链 表 工 ,设计 一 个 算法 释放 其 中 的 所 有 结 点 。 
设 FCL) 的 功能 是 释放 w 一 av。 的 所 有 结 点 , 则 F( 工 一 > next) 的 功能 是 释放 as 一 a 
的 所 有 结 点 ,如 图 5. 6 所 示 。 假 设 F( 工 一 > next) 是 可 实现 的 , 则 f(L) 的 功能 是 先 调 用 
J( 工 一 > next) ,然后 释放 工 所 指 的 结 点 。 
A(D 释 放 a 到 a 的 所 有 结 点 


三 a 
i—=| a | -| «| 2 -| a | 入 









































et 
f(tL->next) 释 放 as 到 a 的 所 有 结 点 


L->next 


图 5.6 一 个 不 带头 结 点 的 单 链表 
对 应 的 递归 模型 如 下 : 


ftL) 不 做 任何 事件 当 L=NULL 时 
f(L) f(L 一 > next); 释放 上 所 指 的 结 点 其 他 情况 


其 中 ,“ ”表示 功能 等 价 关 系 。 对 应 的 算法 如 下 : 


void release(LinkNode * &L) 
{ if(L!=NULL) 
{ release(L 一 next); 
free(L); 
} 
} 


说 明 : 在 对 单 链表 设计 递归 算法 时 通常 采用 不 带头 结 点 的 单 链表 。 以 图 5. 6 为 例 ， 
LL 一 > next 表示 的 单 链表 一 定 是 不 带头 结 点 的 ,也 就 是 说 “小 问题 ”的 单 链表 是 不 带头 结 点 
的 单 链表 ,所 以 “大 问题 "( 即 整 个 单 链表 ) 也 应 设计 成 不 带头 结 点 的 单 链表 。 

所 以 在 设计 递归 算法 时 ,如 果 人 处理 的 数据 是 递归 数据 结构 ,需要 对 该 数据 结构 及 其 递归 
运算 进行 分 析 , 从 而 设计 出 正确 的 递归 体 。 再 假设 一 种 特殊 情况 ,得 到 递归 出 口 。 


533 基于 递归 求解 方法 的 递归 算法 设计 


当 求解 问题 的 方法 是 递归 (如 Hanoi 问题 ) 的 或 者 可 以 转换 成 递归 方法 
求解 时 (如 皇后 问题 ) ,可 以 设计 成 递归 算法 。 














例如 , 求 /07) 二 1 十 2 十 … 十 n(n 宇 1) ,这 个 问题 可 以 转化 为 递归 方法 求 部 枉 车 


解 ,假设 “小 问题 ?是 f(n 一 1)=1 十 2 十 … 十 (n 一 1) ,是 可 求 的 , 则 f(n)==f(n 一 1) 十 n。 

对 于 采用 递归 方法 求解 的 问题 .需要 对 问题 本 身 进行 分 析 , 确 定 大 、 小 问题 解 之 间 的 关 
系 , 构 造 合理 的 递归 体 。 

【 例 5.5】 采用 递归 算法 求解 迷宫 问题 ,并 输出 从 入 口 到 出 口 的 所 有 迷宫 路 径 。 

迷宫 问题 在 第 3 章 中 介绍 过 , 设 mgpath (int xi, int yi,int xe, int ye, PathType 
path) 是 求 从 (xi,yi) 到 (xe,ye) 的 迷宫 路 径 , 用 path 变量 保存 一 条 迷宫 路 径 , 其 中 PathType 
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类 型 的 声明 如 下 。 


typedef struct 

ti 
int j; 

} Box; 

typedef struct 

{ Box data[MaxSize]; 
int length; 

} PathType; 


“B00 





// 方 块 的 行 号 
// 方 块 的 列 号 
// 方 块 的 类 型 


// 存 放 一 条 路 径 上 的 所 有 方块 
// 迷 宫 路 径 的 长 度 
// 迷 宫 路 径 的 类 型 


当 从 (xi,yD) 方 块 找到 一 个 相 邻 的 可 走 方 块 (i, 丫 后 ,mgpath(i,j, xe,ye, path) 表 示 
求 从 (i, 丫 到 出 口 (xe,ye) 的 迷 宣 路径。 显然 ,mgpath(xi,yi,xe,ye,path) 是 “大 问题 ”， 
而 mgpath(i,j ,xe,ye,path) 是 “小 问题 "( 即 大 问题 = 试探 一 步 十 小 问题 )。 求 解 上 述 迷 富 
问题 的 递归 模型 如 下 : 


将 (xi,yi) 添 加 到 path 中 ;输出 path 中 的 迷宫 路 径 ; 
车 (xi, yj) 二 (xe,ye) 即 找到 出 口 
对 于 (xi,yi) 四 周 的 每 一 个 相 邻 方块 (5,j): 若 (xi,yi) 不 是 出 口 且 可 走 
@ 将 (xi,yD 添 加 到 path 中 ; 
© mg[xi [yi]=—1; 
©@ mgpath(i,j, xe, ye, path) ; 
图 path 回 退 一 步 并 置 mg[xi] [yi] =0; 
不 做 任何 事情 ; 


mgpath( xi, yi, xe, ye, path) 


mgpath( xi, yi, xe, ye, path) 


mgpath( xi, yi, xe, ye, path) 车 (xi, yi) 不 是 出 口 且 不 可 走 

在 上 述 递归 模型 中 , 当 完 成 “小 问题 *mgpath (i,j, xe,ye,path) 后 将 path 回 退 并 置 
mg[xij[yi] 为 0( 对 应 @) ,其 目的 是 恢复 前 面 求 迷宫 路 径 而 改变 的 环境 ,以 便 找 出 所 有 的 迷 
宫 路 径 。 对 应 的 递归 算法 如 下 : 


void mgpath(int xi, int yi, int xe, int ye, PathType path) 
// 求 解 迷宫 路 径 为 (xi, yi)->(xe, ye) 
{ intdi,k,i,j; 
if (xi==xe && yi==ye) 
{ path.data[path.length] .i=xi; 
path. data[path. length] .j= yi; 
path. length 二 十 ; 
printf(" 迷 富 路 径 %d 如 下 :\n", 十 十 count); 
for (k=0;k< path.length;k 十 十 ) 
printf("\t( %d, %d)",path.data[k] .i, path. data[k] .j); 


// 找 到 了 出 口 ,输出 一 个 迷宫 路 径 
// 将 (xi,yi) 添 加 到 path 中 


// 输 出 path 中 的 迷宫 路 径 





printf("\n"); 

else //(xi,yi) 不 是 出 口 

{ if (mg[xi][yi]==0) //(xi, yi) 是 一 个 可 走 方块 
{ =0; 


while (di< 4) 
{ path.data[path.length] .i=xi; 


// 处 理 (xi, yi) 四 周 的 每 一 个 相 邻 方块 (i,j) 
//@ 将 (xi,yiD 添 加 到 path 中 


ASAS 这 有 | 


path. data[path.length] .j= yi; 

path.length 十 十 ; // 路 径 长 度 增 1 
switch(di) 

{ 

case 0:i 一 Xi 一 1; j=yi; break; 

case 1: ; j=yi+1; break; 

case 2:j 一 xi 十 1; j=yi; break; 





case 3:i=xi; j=yi—1; break; 


} 

mg[xi] [yi]=—1; //@mg[xi] [yi]=—1 
mgpath(i,j, xe, ye, path) ; //@mgpath(i,j, xe, ye, path) 
mg[xi] [y] =0; // 图 恢复 (xi, yi) 为 可 走 

path. length—— ; // 回 退 一 个 方块 

di 十 十 ; // 继 续 处 理 (xi, yi) 下 一 个 相 邻 方块 


} 


本 算法 输出 所 有 的 迷宫 路 径 , 对 于 如 图 5.7(a) 所 示 的 迷宫 ,指定 入 口 为 (1,1) ,出口 为 
(4,4) , 求 出 的 所 有 迷宫 路 径 有 4 条 ,如 图 5.7(b) 所 示 , 可 以 通过 比较 路 径 长 度 求 出 最 短 迷 
宫 路 径 ( 可 能 存在 多 条 最 短 迷 宫 路 径 ) 。 


wwb 一 口 





径 径 
1 2 


:3 
上 成 票 员 嵌 








(b) 求 出 的 所 有 迷宫 路 径 
图 5.7 一 个 迷宫 及 其 所 有 的 迷宫 路 径 
一 > 本 章 小 结 -和 


本 章 的 基本 学 习 要 点 如 下 : 
(1) 理解 递归 的 定义 和 递归 模型 。 
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(2) 理解 递归 算法 的 执行 过 程 。 
(3) 掌握 递归 算法 设计 的 一 般 方法 。 
(4) 灵活 地 运用 递归 算法 解决 一 些 较 复杂 的 应 用 问题 。 


一 练习 题 5 一 一 


1. 有 以 下 递归 函数 
void fun(int n) 
{ if(n==1) 
printf("a: % d\n",n); 
else 
{printf("b:%d\n",n); 
fun(n—1); 


printf("c: %d\n",n); 


} 


分 析 调 用 fun(5) 的 输出 结果 。 

2. 已 知 A[0..n 一 1] 为 整数 数组 ,设计 一 个 递归 算法 求 这 个 元 素 的 平均 值 。 

3. 设计 一 个 算法 求 正 整 数 的 位 数 。 

4. 上 楼 可 以 一 步 上 一 阶 , 也 可 以 一 步 上 两 阶 , 设 计 一 个 递归 算法 ,计算 共有 多 少 种 不 同 

5. 设计 一 个 递归 算法 ,利用 顺序 串 的 基本 运算 求 串 * 的 逆 串 。 

6. 设 有 一 个 不 带 表 头 结 点 的 单 链表 二 ,设计 一 个 递归 算法 count(L) 求 以 工 为 首 结 点 指 
针 的 单 链表 的 结 点 个 数 。 

7. 设 有 一 个 不 带 表 头 结 点 的 单 链表 工 , 设 计 两 个 递归 算法 ,traverse(L) 正 向 输出 单 链 
表 工 的 所 有 结 点 值 ,traverseR(L) 反 向 输出 单 链表 工 的 所 有 结 点 值 。 

8. 设 有 一 个 不 带 表 头 结 点 的 单 链表 二 ,设计 两 个 递归 算法 ,del(L,z) 删 除 单 链表 工 中 
第 一 个 值 为 zx 的 结 点 ,delall(L,z) 删 除 单 链 表 工 中 所 有 值 为 zx 的 结 点 。 

9. 设 有 一 个 不 带 表 头 结 点 的 单 链表 工 , 设 计 两 个 递归 算法 ,maxnode(L) 返 回 单 链表 工 
中 的 最 大 结 点 值 ,minnodel(L) 返 回 单 链表 工 中 的 最 小 结 点 值 。 

10. 设计 一 个 模式 匹配 算法 ,其 中 模板 串 上 含有 通配符 '* ', 它 可 以 和 任意 子 串 匹配 。 
对 于 目标 串 *, 求 其 中 匹配 模板 : 的 一 个 子 串 的 位 置 ('* 不 能 出 现在 : 的 开头 和 末尾 ) 。 


一 人 ~- 上 机 实验 题 5 一 一 


戎 验证 性 实验 
实验 题 1: 采用 递归 和 非 递归 方法 求解 Hanoi 问题 
目的 : 领会 基本 递归 算法 设计 和 递归 到 非 递归 的 转换 方法 。 
内 容 : 编写 程序 exp5-1. cpp, 采 用 递归 和 非 递归 方法 求解 Hanoi 问题 ,输出 3 个 盘 片 的 


ASS 这 有 





移动 过 程 。 

实验 题 2: 求 路 径 和 路 径 条 数 问题 

目的 : 领会 基本 递归 算法 设计 和 递归 执行 过 程 。 

内 容 : 编写 程序 exp5-2. cpp, 求 路 径 和 路 径 条 数 问题 。 有 一 个 m Xn 的 网 格 ,图 5.8 所 
示 为 一 个 2X5 的 网 格 。 现 在 一 个 机 器 人 位 于 左上 角 , 该 机 器 人 在 任何 位 置 上 时 只 能 向 下 或 
者 向 右 移 动 一 步 , 问 机 器 人 到 达 网 格 的 右 下 角 (1,1) 位 置 的 ”02,5) 
所 有 可 能 的 路 径 条 数 ,并 输出 所 有 的 路 径 。 以 m= 二 2,n 二 2 为 
例 说 明 输出 所 有 的 路 径 的 过 程 。 
戎 设计 性 实验 

实验 题 3: 恢复 IP 地 址 图 5.8 一 个 2X5 的 网 格 

目的 : 掌握 基本 递归 算法 设计 。 

内 容 : 编写 程序 exp5-3. cpp, 恢 复 IP 地 址 。 给 定 一 个 仅仅 包含 数字 的 字符 串 ,恢复 它 
的 所 有 可 能 的 有 效 IP 地址。 例如 ,给 定 字符 串 为 "25525511135" ,返回 "255. 255. 11. 135" 
和 "255. 255. 111. 35"( 顺 序 可 以 任意 ) 。 


实验 题 4: 高 效 求 解 x" 

目的 : 掌握 基本 递归 算法 设计 。 

内 容 : 编写 程序 exp5-4. cpp ,高 效 求 解 x" ,要 求 最 多 使 用 O(logsn) 次 递归 调用 。 

实验 题 5: 用 递归 方法 逆 置 带头 结 点 的 单 链表 

目的 : 掌握 单 链表 递归 算法 设计 方法 。 

内 容 : 编写 一 个 程序 exp5-6. cpp, 用 递归 方法 逆 置 一 个 带头 结 点 的 单 链 表 。 

实验 题 6: 用 递归 方法 求 单 链表 中 的 倒数 第 大 个 结 点 

目的 : 掌握 单 链表 递归 算法 设计 方法 。 

内 容 : 编写 一 个 程序 exp5-6. cpp, 用 递归 方法 求 单 链表 中 的 倒数 第 人 个 结 点 。 
早 综 合 性 实验 

实验 题 7: 用 递归 方法 求解 n 皇后 问题 

目的 : 深入 掌握 递归 算法 设计 方法 。 

内 容 : 编写 一 个 程序 exp5-7. cpp, 用 递归 方法 求解 n 皇后 问题 ,对 皇后 问题 的 描述 参见 
第 3 章 的 实验 题 8。 

实验 题 8: 用 递归 方法 求解 0/1 背包 问题 

目的 : 深入 掌握 递归 算法 设计 方法 。 











内 容 : 编写 一 个 程序 exp5-8. cpp, 用 递归 方法 求解 0/1 背包 问题 。0/1 背包 问题 是 , 设 


有 不 同 价值 不 同 重量 的 物品 件 , 求 从 这 件 物品 中 选取 一 部 分 物品 的 方案 ,使 选中 物品 
的 总 重量 不 超过 指定 的 限制 重量 W ,但 选中 物品 的 价值 之 和 为 最 大 。 注 意 ,每 种 物品 要 么 
被 选中 ,要 么 不 被 选中 。 
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数组 (array) 是 具有 相同 类 型 的 数据 元 素 的 有 限 序列 , 可 以 将 它 
看 作 是 线性 表 的 推广 , 稀 玖 和 矩 阵 是 一 种 特殊 的 二 维 数组 。 广 义 表 也 
可 以 看 成 是 线性 表 的 推广 , 它 是 采用 递归 方法 定义 的 。 

本 章 介绍 数组 稀 朴 矩阵 和 广义 表 的 存储 结构 及 相关 算法 
设计 。 


四 9 自 数组 和 广义 表 





611 数组 的 基本 概念 


从 逮 辑 结构 上 看 ,一 维 数组 A 是 n(n 二 1) 个 相同 类 型 数据 元 素 ai ， 

as，…,an 构成 的 有 限 序列 ,其 逻辑 表示 如 下 : 
A=(ai,azs,*"* ,an) 视频 讲解 

其 中 ,a;(1 志 i 二 nn) 表示 数组 A 的 第 i 个 元 素 。 

一 个 二 维 数组 可 以 看 作 是 每 个 数据 元 素 都 是 相同 类 型 的 一 维 数组 的 一 维 数组 。 依 此 类 
推 ,任何 多 维 数组 都 可 以 看 作 一 个 线性 表 , 这 时 线性 表 中 的 每 个 数据 元 素 也 是 一 个 线性 表 。 

推广 到 d(d 三 3) 维 数组 ,不 妨 把 它 看 作 一 个 由 d 一 1 维 数组 作为 数据 元 素 的 线性 表 ; 或 
者 可 以 这 样 理解 , 它 是 一 种 较 复杂 的 线性 结构 ,由 简单 的 数据 结构 ( 即 线 性 表 ) 辑 转 合成 而 
得 。 所 以 说 数组 是 线性 表 的 推广 。 在 d 维 数组 中 ,每 个 元 素 的 位 置 由 qd 个 整数 的 d 维 下 标 
来 标识 。 














d 维 数组 的 抽象 数据 类 型 描述 如 下 : 
ADT Array 
{ 数据 对 象 : 
D= {a | ji=1 bi i=1,2, 1d) // 第 i 维 的 长 度 为 bi 
数据 关系 : 


R= {nrs, ,ra} 
六 一 低估 > | Sib,,1<kSd RAL, Sb—1,i=2, -… ,d} 
基本 运算 : 
initarray(&A) : 初始 化 数组 , 即 为 数组 A 分 配 存储 空间 
Destroyarray( &A): 销毁 数组 , 即 释放 数组 A 的 存储 空间 
Value(A,indexi ,indexs ,…,indexs): A 是 已 存在 的 d 维 数组 ,index ,indexs , … , indexs 是 指定 的 
d 维 下 标 ,这 些 下 标 均 在 有 效 范围 内 .其 运算 结果 是 返回 由 该 下 标 指定 的 A 中 的 对 应 元 素 
的 值 
Assign(A,e,indexi ,indexs ,…,indexs): A 是 已 存在 的 d 维 数组 ,e 为 元 素 变量 ,index 、indexs 、…、 
indexs 是 指定 的 d 维 下 标 ,这 些 下 标 均 在 有 效 范围 内 .其 运算 结果 是 将 e 的 值 赋 给 A 中 由 
该 下 标 指定 的 元 素 





从 上 可 以 看 出 ,数组 除了 初始 化 和 销毁 以 外 ,在 数组 中 通常 只 有 下 面 两 种 操作 。 






-组 下 标 , 存 储 或 者 修改 相应 的 数组 元 素 。 

几乎 所 有 的 计算 机 高 级 语言 都 实现 了 数组 数据 结构 ,并 称 之 为 数组 类 型 。 这 里 以 
C/C++ 语言 为 例 , 其 中 数组 数据 类 型 具有 以 下 性 质 : 

(1) 数组 中 的 数据 元 素数 目 固定 ,一 旦 定义 了 一 个 数组 ,其 数据 元 素数 目 不 再 有 增 减 的 
变化 。 

(2) 数组 中 的 数据 元 素 具 有 相同 的 数据 类 型 。 


组 下 标 , 读 取 相应 的 数组 元 素 。 aa 
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(3) 数组 中 的 每 个 数据 元 素 都 和 一 组 唯一 的 下 标 对 应 。 

(4) 数组 是 一 种 随机 存储 结构 ,可 随机 存 取 数组 中 的 任意 数据 元 素 。 

因此 ,用 户 可 以 在 C/C++ 程序 中 直接 使 用 数组 来 存放 数据 ,并 使 用 数组 的 运算 符 来 完 
成 相应 的 功能 。 

【 例 6.1】 利用 数组 求解 约瑟夫 问题 : 设 及 个 人 站 成 一 圈 , 其 编号 为 1~~n。 从 编号 
为 1 的 人 开始 按 顺 时 针 方向 "1,2,3,4,…” 循 环 报 数 , 数 到 mm 的 人 出 列 ,然后 从 出 列 者 的 下 
一 个 人 重新 开始 报 数 , 数 到 m 的 人 又 出 列 ,如 此 重复 进行 ,直到 个 人 都 出 列 为 止 ,要 求 输 
出 这 浆 个 人 的 出 列 顺序 。 

例如 ,有 8 个 人 的 初始 序列 为 





人 


当 m= 二 4 时 ,出 列 顺序 为 


| RE 0 7 0 We 


采用 一 维 数组 p[L] 存 放 人 的 编号 , 先 将 个 人 的 编号 存 人 到 p[L0j]~pLn 一 1] 中 。 从 
编号 为 1 的 人 (下 标 4==0) 开 始 循环 报 数 , 数 到 mm 的 人 p[]( 下 标 1 二 (十 m 一 1) %i,i 表示 当 
前 未 出 列 的 人 数 ) 输 出 并 将 其 从 数组 中 删除 (即将 后 面 的 元 素 前 移 一 个 位 置 ) ,因此 每 次 报 数 
的 起 始 位 置 就 是 上 次 报 数 的 出 列 位 置 。 反 复 执行 直到 出 列 个 人 为 止 。 算 法 如 下 : 


void josephus(int n, int m) 
{ int pLMaxSize] ; 


int i,j, t; 
for (i=0;i<n;i+ 二 ) // 构 建 初始 序列 (1,2,…,n) 

p 口 =i 十 1; 
t=0; // 首 次 报 数 的 起 始 位 置 
printf(" 出 列 顺序 :"); 
for (i=n;i>=1;i——) //i 为 数组 p 中 当前 的 人 数 ,出 列 一 次 ,人 数 减 1 
{ t=(t+m-—1)%i; //t 为 出 列 者 的 编号 

printf("%d ",p[ 吕 ); // 编 号 为 t+ 的 元 素 出 列 

for (=t+1;j<=i 一 1;j 十 十) // 后 面 的 元 素 前 移 一 个 位 置 

pG—1]=p0]; 


} 
Pprintf("\n"); 
} 


需要 注意 的 是 ,本 章 的 数组 是 作为 一 种 数据 结构 讨论 的 ,而 C/C++ 中 的 数组 是 一 种 数 
据 类 型 ,前 者 可 以 借助 后 者 来 存储 , 像 线 性 表 的 顺序 存储 结构 ( 即 顺序 表 ) 就 是 借助 一 维 数组 
这 种 数据 类 型 来 存储 的 。 但 二 者 不 能 混淆 。 扫 -- 扫 
612 数组 的 存储 结构 


在 设计 数组 的 存储 结构 时 ,通常 将 数组 的 所 有 元 素 存储 到 存储 器 的 一 
块 地 址 连续 的 内 存单 元 中 , 即 数组 特别 适合 采用 顺序 存储 结构 来 存储 。 视频 讲解 
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对 于 一 维 数组 (a ,as，…,a;，…，,a,), 按 元 素 顺 序 存 储 到 一 块 地 址 连续 的 内 存单 元 中 。 
假设 第 一 个 元 素 w 的 存储 地 址 用 LOC(a ) 表 示 , 每 个 元 素 占 用 个 存储 单元 , 则 任 一 数组 
元 素 w 的 存储 地 址 LOC(Ca;) 即 可 由 以 下 公式 求 出 : 

LOC(ai) = LOCCa ) + (i—1) xk (2<i<n (6.1) 

该 式 说 明 一 维 数组 中 任 一 元 素 的 存储 地 址 可 直接 计算 得 到 , 即 一 维 数组 中 的 任 一 元 素 
可 直接 存 取 , 正 因为 如 此 ,一 维 数组 具有 随机 存储 特性 。 

2 


对 于 一 个 mm 行 n 列 的 二 维 数组 A,x，: 
Qa2z,1 Q2,2 -a 


Qml Am2 ”Admn 
将 Anx, 简 记 为 A ,A 是 这 样 的 一 维 数组 : 
A=(Ai,As,… ,A;,.…,A,.) 
其 中 ,A;=(aiyakzy 和 yain) (li<m) 
对 于 二 维 数组 来 说 ,其 存储 方式 主要 有 两 种 , 即 按 行 优先 存放 (或 者 以 行 序 为 主 序 存 放 ) 
和 按 列 优先 存放 (或 者 以 列 序 为 主 序 存放 ) 。 
1) 二 维 数组 按 行 优先 存放 
二 维 数组 按 行 优先 存放 的 示意 图 如 图 6. 1 所 示 , 即 先 存储 第 1 行 , 紧 接着 存储 第 2 行 …… 
依 此 类 推 , 最 后 存储 第 m 行 。 





共 门 行 , (i-1)xn 个 元 碌 


| 第 i 行 中 ov 前 面 有 (-D 个 元 素 
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第 1 行 第 2 行 第 ? 行 第 交行 
6.1 二 维 数组 按 行 优先 存放 的 示意 图 





假设 第 一 个 元 素 w,; 的 存储 地 址 用 LOC(a1, ) 表 示 ,每 个 元 素 占 用 & 个 存储 单元 , 则 该 

二 维 数组 中 的 任 一 元 素 aiv 的 存储 地 址 可 由 下 式 确定 : 
LOC(aij) = LOCCas) 十 [G 一 1) Xnt+G—D DIXEk (6.2) 
上 式 推导 的 思路 是 ,在 内 存 中 元 素 ov 前面 有 i 一 1 行 ,每 行 2 个 元 素 , 即 已 存放 了 
(i 一 1) Xn 个 元 素 , 占 用 了 (i 一 1) XnXk 个 内 存单 元 ; 在 第 i 行 中 元 素 a;,; 前 面 有 j 一 1 个 元 
素 , 即 已 存放 了 j 一 1 个 元 素 , 占 用 了 (一 1) Xk 个 内 存单 元 ; 该 数组 是 从 基地 址 LOC(a,1) 
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开始 存放 的 。 所 以 ,元素 civ 的 内存 地 址 为 上 述 3 个 部 分 之 和 。 

以 上 讨论 假设 二 维 数组 的 行列 下 界 为 1。 在 更 一 般 的 情况 下 ,假设 二 维 数组 的 行 下 界 是 
cl, 行 上 界 是 四 , 列 下 界 是 c , 列 上 界 是 心 , 即 数组 A[c..di ,co..ds]?, 则 式 (6.2) 可 改写 为 : 

LOC(eiy) = LOC(aa,a) 十 [G 一 ca) X (ds 一 cs 十 1) 十 G 一 cs)]XR (6.3) 

2) 二 维 数组 按 列 优先 存放 

当 二 维 数组 采用 以 列 序 为 主 序 的 存储 方式 时 , 先 存 储 第 1 列 , 紧 接着 存储 第 2 列 ,…, 依 
此 类 推 ,最 后 存储 第 列 。 

与 式 (6. 2) 的 推导 过 程 相似 ,得 出 以 列 序 为 主 序 的 存储 方式 下 元 素 ai,; 的 存储 地 址 可 由 
下 式 确定 : 








LOC(aij) = LOC(a) 十 [G 一 1) Xm+t+(i—1)] Xk (6.4) 
同样 ,在 更 一 般 的 情况 下 ,假设 二 维 数组 的 行 下 界 是 ci , 行 上 界 是 di , 列 下 界 是 cs , 列 上 
界 是 心 , 则 式 (6. 4) 可 改写 为 : 
LOC(aij) = LOCCaae) 十 [LO 一 co) X(d 一 c 十 1D) 十 (一 co)]XA (6.5) 
从 中 可 以 看 出 ,二 维 数组 无 论 按 行 优先 存储 还 是 按 列 优先 存放 存储 ,都 可 以 在 O(1) 的 
时 间 内 计算 出 指定 下 标 元 素 的 存储 地 址 ,体现 出 随机 存储 特性 。 
可 以 将 以 上 二 维 数组 存储 方法 的 思路 推广 到 三 维 数组 和 更 高 维 数组 。 对 于 高 维 数组 , 按 
行 优先 存储 的 思路 是 最 右边 的 下 标 先 变化 , 即 最 右 下 标 从 小 到 大 ,循环 一 遍 后 ,右边 第 二 个 下 
标 再 变化 ,……, 依 此 类 推 , 最 后 是 最 左下 标 。 按 列 优先 存储 的 思路 是 最 左边 的 下 标 先 变 化 , 即 
最 左下 标 从 小 到 大 ,循环 一 遍 后 ,左边 第 二 个 下 标 再 变化 ,…, 依 此 类 推 ,最 后 是 最 右 下 标 。 
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特殊 矩阵 是 指 非 零 元 素 或 零 元 素 的 分 布 有 一 定 规 律 的 窍 阵 ,为 了 节省 存储 空间 ,特别 是 在 
高 阶 和 矩阵 的 情况 下 ,可 以 利用 特殊 矩阵 的 规律 对 它们 进行 压缩 存储 ,以 提高 存储 空间 效率 。 

特殊 矩阵 的 主要 形式 有 对 称 和 矩阵 ` 对 角 和 矩阵 等 。 它 们 都 是 方 阵 ,即行 数 和 列 数 相同 。 

车 一 个 n 阶 方 阵 A[nj[n] 中 的 元 素 满足 a;,; 二 aj,;(0 志 i,j 志 n 一 1), 则 称 其 为 n 阶 对 称 和 矩 
阵 (symmetric matrix) 。 

一 般 情况 下 ,一 个 n 阶 方 阵 的 所 有 元 素 可 以 分 为 3 个 部 分 , 即 主 对 角 部 分 ( 含 n 个 元 
素 )、 上 三 角 部 分 和 下 三 角 部 分 ,如 图 6.2 所 示 。 已 知 一 个 元 素 的 下 标 ,就 可 以 确定 它 属 于 哪 
个 部 分 。 

对 称 和 矩阵 中 的 元 素 是 按 主 对 角 线 对 称 的 , 即 上 三 角 部 分 和 下 三 角 部 分 中 的 对 应 元 素 相 
等 ,因此 在 存储 时 可 以 只 存储 主 对 角 线 加 上 三 角 部 分 的 元 素 ,或 者 主 对 角 线 加 下 三 角 部 分 的 
元 素 , 让 对 称 的 两 个 元 素 共 享 一 个 存储 空间 。 

不 失 一 般 性 ,对 称 矩 阵 采 用 以 行 序 为 主 序 存储 主 对 角 线 加 下 三 角 部 分 的 元 素 。 如 
图 6. 3 所 示 ,假设 以 一 维 数组 BL[0..n(n 十 1)/2 一 1] 作 为 阶 对 称 和 矩阵 A 的 存储 结构 ,4 中 
的 元 素 a;,; 存 储 在 B 中 的 元 素 b 中 ,那么 与 i.j 是 什么 关系 呢 ? 分 为 以 下 两 种 情况 : 








@@ A[a1..d1,cz..dz] 表 示 数 组 A 的 行 号 从 ci 到 cz, 列 号 从 di 到 d:。 例 如 ,由 于 C/C++ 语言 中 规定 数组 下 标 从 0 开 
始 , 所 以 A[m] 数 组 可 以 表示 为 A[0..m 一 1],ALmj[n] 或 A[m,n] 数 组 可 以 表示 为 A[0..m 一 1,0..n 一 1]。 
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下 三 角 部 分 元 素 a;j: i>j 


图 6.2 一 个 nn 阶 方 阵 的 3 个 部 分 





上 三 角 部 分 元 素 ov : i<j 





主 对 角 线 部 分 元 素 qi : 茹 
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(1) 车 aij 是 A 中 主 对 角 线 或 者 下 三 角 部 分 的 元 素 , 有 i 三 j。 在 以 行 序 为 主 序 的 存储 方 
式 下 不 计 行 下 标 为 i 的 行 ,元 素 ai,; 的 前 面 共存 储 了 i 行 ( 行 下 标 为 0~i 一 1, 行 下 标 为 0 的 
行 有 一 个 元 素 , 行 下 标 为 1 的 行 有 两 个 元 素 ,…, 行 下 标 为 i 一 1 的 行 有 i 个 元 素 ), 这 i 行 有 
1 十 2 十 … 十 i 二 i(i 十 1)/2 个 元 素 ; 在 行 下 标 为 i 的 行 中 ,元 素 aiv 的 前 面 也 存储 了 7 个 元 素 。 
所 以 元 素 a 的 前 面 共 存储 了 i(i 十 1)/2 十 j 个 元 素 , 而 B 数组 的 下 标 也 是 从 0 开始 的 ,所 以 
上 1)V2 十 7 。 
(2) 若 是 4 中 上 三 角 部 分 的 元 素 , 有 i 二 ;。 其 值 等 于 aj,; ,而 元 素 w, 属于 情况 (1)， 
它 存放 在 B 中 下 标 为 jG 十 1)/2 十 i 的 位 置 ,所 以 此 时 有 k=j (十 1)/2 十 i。 
将 两 种 情况 合 起 来 ,得 到 与 i\j 的 关系 如 下 
ii 十 1) 
2 


有 k==i(i+ 





图 6.3 对 称 和 矩阵 的 压缩 存储 


k= 


jG+D 
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十 7 i 宇 j 





(6.6) 


+i i<j 


显然 ,一 维 数组 B 中 存放 的 元 素 个 数 为 1 十 2 十 … 十 n 二 n(n 十 1)/2。 如 果 A 直接 采用 一 
个 nn 行 n 列 的 二 维 数组 存储 ,所 需要 的 存储 空间 为 nw? 个 元 素 , 所 以 这 种 压缩 存储 方法 几乎 
节省 了 一 半 的 存储 空间 。 另 外 .由 于 一 维 数组 B 具有 随机 存 取 特性 ,所 以 采用 这 种 压缩 存 
储 方法 后 对 称 和 矩阵 4 仍然 具有 随机 存 取 特性 。 

归纳 起 来 ,在 计算 4 中 元 素 a;,; 在 B 中 存储 位 置 k 时 ,首先 求 出 元 素 iv 前 面 共 存放 多 
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少 个 元 素 ( 设 为 m 个); 再 看 B 中 存放 元 素 的 下 标 是 从 0 开始 还 是 从 1 开始 ( 设 B 的 初始 下 
标 为 5), 则 ==m 十 s。 


所 谓 上 三 角 和 矩阵 (upper triangular matrix) ,是 指 矩阵 的 下 三 角 部 分 中 的 元 素 均 为 常数 
c 的 n 阶 方 阵 。 同 样 , 下 三 角 矩 阵 (lower triangular matrix) 是 指 和 矩阵 的 上 三 角 部 分 中 的 元 
素 均 为 常数 c 的 n 阶 方 阵 。 

对 于 上 三 角 和 矩阵 ,其 压缩 存储 方法 是 采用 以 行 序 为 主 序 存储 其 主 对 角 线 加 上 三 角 部 分 
的 元 素 ,另外 用 一 个 元 素 存 储 常 数 ,并 将 压缩 结果 存放 在 一 维 数组 B 中 ,如 图 6.4 所 示 。 
显然 ,B 中 元 素 的 个 数 为 n(n 十 1)/2 十 1, 即 用 BL0..z(z 十 1)/2] 存 放 A 中 的 元 素 。 
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图 6.4 上 三 角 和 矩阵 的 压缩 存储 


同样 ,4 中 元 素 ai, 存 储 在 B 的 元 素 654 中 ,那么 与 i\j 是 什么 关系 呢 ? 这 里 也 分 为 如 
下 两 种 情况 : 
(1) 车 ai 是 A 中 主 对 角 线 或 者 上 三 角 部 分 的 元 素 , 有 i 三 ;。 在 以 行 序 为 主 序 的 存储 方 
式 下 不 计 行 下 标 为 i 的 行 ,元 素 ai,; 的 前 面 共存 储 了 i 行 ( 行 下 标 为 0~i 一 1, 行 下 标 为 0 的 
行 有 nn 个 元 素 , 行 下 标 为 1 的 行 有 nn 一 1 个 元 素 ,…, 行 下 标 为 i 一 1 的 行 有 nn 一 i 十 1 个 元 素 )， 
这 i 行 有 nn 十 (mn 一 了 十 … 十 (n 一 i 十 1) 二 i(2n 一 i 十 1)/2 个 元 素 ; 在 行 下 标 为 i 的 行 中 ,元 素 
ai 的 前 面 也 存储 了 7 一 ; 个 元 素 。 所 以 元 素 ai,; 的 前 面 共存 储 了 i(2n 一 i 十 1)/2 十 j 一 i 个 元 
素 , 而 B 数 组 的 下 标 也 是 从 0 开始 的 ,所 以 有 k=i(2n 一 i 十 1)/2 十 j 一 i。 
(2) 车 aij 是 A 中 下 三 角 部 分 的 元 素 , 有 i>j。 其 值 为 常数 c, 用 B 中 最 后 一 个 位 置 ( 即 
下 标 为 n(n 十 1)/2 的 元 素 ) 存 放 常 数 c。 
将 两 种 情况 合 起 来 ,得 到 与 i\j 的 关系 如 下 : 
in 一 Di 一 ji <j 
一 (6.7) 
一 -一 - Ss 
对 于 下 三 角 和 矩阵 A, 其 常见 的 压缩 存储 方法 是 采用 以 行 序 为 主 序 存储 其 主 对 角 线 加 下 
三 角 部 分 的 元 素 , 另 外 用 一 个 元 素 存 储 常数 c, 并 将 压缩 结果 存放 在 一 维 数组 B 中 ,采用 类 
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似 于 对 称 和 矩阵 的 推导 过 程 ,得 到 与 i\j 的 关系 如 下 : 
一 一 - 4 宇 写 1 


k= (6.8) 
二 一 i 


车 一 个 阶 方 阵 A 满足 其 所 有 非 零 元 素 都 集中 在 以 主 对 角 线 为 中 心 的 带 状 区 域 中 , 则 
称 其 为 怀 阶 对 角 和 矩阵 (diagonal matrix) 。 其 主 对 角 线 上 、 下 方 各 有 6 条 非 零 元 素 构 成 的 次 对 
角 线 , 称 5 为 矩阵 半 带 宽 ,(25 十 1) 为 矩阵 的 带宽 。 对 于 半 带 宽 为 5(0<b 夺 (mn 一 1)/2) 的 对 角 算 
阵 , 其 |i 一 j| 二 6 的 元 素 ai,j 不 为 零 ,其 余 元 素 为 零 。 图 6. 5 所 示 为 半 带 宽 为 6 的 对 角 和 矩阵 示 
意图 。 

对 于 6b 二 1 的 三 对 角 和 矩阵 ,只 存储 其 非 零 元 素 , 并 存储 到 一 维 数 
组 B 中 ,将 4 的 非 零 元 素 a;, 存 储 到 B 的 元 素 b 中 。 

A 中 行 下 标 为 0 的 行 和 行 下 标 为 n 一 1 的 行 都 只 有 两 个 非 零 元 
素 ,其 余 各 行 有 3 个 非 零 元 素 。 

对 于 行 下 标 不 为 0 的 非 零 元 素 ai,j; 来 说 ,在 它 前 面 存储 了 和 矩阵 图 6.5 半 带 宽 为 6 的 
的 前 i 行 元 素 , 这 些 元 素 的 总 数 为 2 十 3(i 一 1)。 元 素 ov 在 行 下 标 对 角 和 矩阵 
为 i 的 行 (本 行 ) 中 分 为 3 种 情况 : 

(1) 若 ai,; 是 本 行 中 的 第 1 个 非 零 元 素 , 则 k=2 十 3(i 一 1)==3i 一 1, 此 时 j=i 一 1, 即 外 
2i+i—1=2i 十 j。 
(2) 若 aj; 是 本 行 中 的 第 2 个 非 零 元 素 , 则 k=2 十 3(i 一 1) 十 1==3i, 此 时 i=j, 即 
2i 十 ;一 2i 十 7 。 

(3) 车 ai,; 是 本 行 中 的 第 3 个 非 零 元 素 , 则 ==2 十 3(i 一 1) 十 2=3i 十 1, 此 时 j=i 十 1, 即 
k=2i 十 i 十 1 二 2i 十 j。 

归纳 起 来 有 k==2i 十 j。 

以 上 讨论 的 对 称 和 矩阵 ,三 角 和 矩阵 、 对 角 和 矩阵 的 压缩 存储 方法 是 把 分 布 有 规律 的 特殊 元 素 
( 值 相同 元 素 、 常 量 元 素 ) 压 缩 存储 到 一 个 存储 空间 中 ,这 样 的 压缩 存储 只 需 在 算法 中 按 公 式 
做 映射 即 可 实现 特殊 矩阵 元 素 的 随机 存 取 。 


当 一 个 阶 数 较 大 的 矩阵 中 的 非 零 元 素 个 数 s 相对 于 矩阵 元 素 的 总 个 数 扫 -- 扫 
t 非常 小 时 , 即 y*<<z 时 , 称 该 矩阵 为 稀 朴 矩阵 (sparse matrix)。 例 如 一 个 
100X100 的 矩阵 , 若 其 中 只 有 100 个 非 零 元 素 , 就 可 称 其 为 稀 朴 矩阵 。 

稀 朴 矩阵 和 上 一 节 介 绍 的 特殊 矩阵 相 比 有 一 个 明显 的 差异 : 特殊 矩阵 
中 特殊 元 素 的 分 布 具有 某 种 规律 ,而 稀 朴 矩阵 中 特殊 元 素 ( 非 零 元 素 ) 的 分 视频 讲解 
布 没 有 规律 , 即 具 有 随机 性 。 
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稀 玖 矩阵 抽象 数据 类 型 与 4(d 二 2) 维 数组 抽象 数据 类 型 的 描述 相似 ,这 里 不 再 介绍 。 


621 稀 玻 和 矩 阵 的 三 元 组 表示 


不 同 于 前 面 讨论 的 特殊 矩阵 的 压缩 存储 方法 , 稀 朴 矩阵 的 压缩 存储 方法 是 只 存储 非 零 
元 素 。 由 于 稀疏 矩阵 中 非 零 元 素 的 分 布 没 有 任何 规律 ,所 


0010000 
0200000 以 在 存储 非 零 元 素 时 必须 同时 存储 该 非 零 元 素 对 应 的 行 下 
he =|o . 6 ; 1 标 、 列 下 标 和 元 素 值 。 这 样 稀 朴 矩阵 中 的 每 一 个 非 零 元 素 
en 由 一 个 三 元 组 (i,j,ai, ) 唯 一 确定 , 稀 朴 矩阵 中 的 所 有 非 零 
0000074 元 素 构 成 三 元 组 线性 表 。 
图 6.6 稀 玖 矩阵 A 假设 有 一 个 6X7 阶 稀 朴 矩阵 4,4 中 的 元 素 如 图 6. 6 


所 示 。 
则 对 应 的 三 元 组 线性 表 为 : 
((0,2,1),(1,1,2),(2,0,3),(3,3,5),(4,4,6),(5,5,7),(5,6,4)) 
若 把 稀疏 矩阵 的 三 元 组 线性 表 按 顺序 存储 结构 存储 , 则 称 为 稀 朴 矩阵 的 三 元 组 顺序 表 ， 
简称 为 三 元 组 表 (list of 3-tuples) 。 三 元 组 顺序 表 的 数据 类 型 声明 如 下 : 


# define M < 稀 政 矩阵 行 数 > 

# define N < 稀 朴 矩阵 列 数 > 

# define MaxSize < 稀疏 矩阵 中 非 零 元 素 最 多 的 个 数 > 
typedef struct 


{ intr; // 行 号 
int ce; // 列 号 
ElemType d; // 元 素 值 
} TupNode; // 三 元 组 类 型 
typedef struct 
{ introws; // 行 数 
int cols; // 列 数 
int nums; // 非 零 元素 个 数 
TupNode data[MaxSize] ; 
} TSMatrix; // 三 元 组 顺序 表 的 类 型 


其 中 ,data 域 中 表示 的 非 零 元 素 通常 以 行 序 为 主 序 排列 , 即 为 一 种 下 标 按 行 有 序 的 存储 结 
构 。 例 如 ,前 面 的 稀 朴 矩阵 A 对 应 的 三 元 组 表示 如 图 6.7 所 示 。 这 种 有 序 存储 结构 可 简化 
大 多 数 稀 朴 矩阵 运算 算法 ,下 面 的 讨论 都 假设 data 域 是 按 行 有 序 存储 的 。 
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0010000 0 2 1 

扫 -- 要 0200000 1 1 2 
3000000 2 0 3 

4 和 -ooosooo 本 下 和 
0000600 4 4 6 

0000074 5 5 7 

视频 讲解 a & 4 














6.7 稀 朴 矩阵 A 对 应 的 三 元 组 表示 


@08, 数组 和 广义 表 





稀疏 矩阵 的 运算 包括 和 矩阵 转 置 ,矩阵 加 、 矩 阵 减 和 矩阵 乘 等 ,这 里 仅 讨 论 一 些 基本 运算 
算法 。 





1T* 从 一 个 二 维 稀 下 算 阵 创 建 其 三 元 钥 表 不 


采用 以 行 序 为 主 序 的 方式 扫描 二 维 稀 政 矩阵 4, 将 其 中 非 零 的 元 素 依次 插入 到 三 元 组 
顺序 表 : 中 。 算 法 如 下 : 


void CreateMat( TSMatrix &t,ElemType A[M] [N]) 
{ inti,j; 
t.rows=M; t.cols=N; t.nums=0; 
for (i=0;i< Mi;i 十 十 ) 
{ for Gj=0;jj<Ni;j 十 十 ) 
if (ADIO]!=0) // 只 存储 非 零 元 素 
t.data[t.nums] .r 一 iit.data[t.nums] .c=j; 
t.data[t. nums] .d= A[D 0];t.nums+t 十 ; 
} 


该 运算 就 是 对 于 稀疏 矩阵 4 执行 A[ 门 [站 二 x(z 通常 是 一 个 非 零 值 )。 先 在 三 元 组 顺 
序 表 : 中 找到 适当 的 位 置 k ,如 果 该 位 置 对 应 一 个 非 零 元 素 , 将 其 4 数据 域 修改 为 xz; 否则 
需要 插入 一 个 非 零 元 素 ,将 ~1. nums 一 1 的 元 素 均 后 移 一 个 位 置 , 再 将 非 零 元 素 x 插入 到 
4. data[k] 处 。 算 法 如 下 : 


bool Value( TSMatrix &:t, ElemType x, int i,int j) 


{ intk=0,kl; 
if (i>=t. rows | j>=t.cols) //ij 参数 超 界 
return false; // 返 回 假 
while (k<t.nums &&i>t.data[k] .r) k 十 十 ; // 查 找到 第 i 行 的 第 一 个 非 0 元 素 
while (k<t.nums &&i==t.data[k].r && j>t.data[k].c) 
kk 十 十; // 在 第 i 行 的 非 0 元 素 中 查找 第 j 列 
if (t. data[k] .r==i && t. data[k] .c==j) // 若 存在 这 样 的 非 0 元素 
t. data[k] .d 一 xi; // 修 改 非 0 元 素 值 
else // 若 不 存在 这 样 的 非 0 元 素 
for (kl 王 t.nums 一 1;kl > 一 k;kl 一 一 ) // 若 干 元 素 均 后 移 一 个 位 置 


{ t.data[fkl+1].r=t.data[kl].r; 
t. data[kl+1].c=t.data[kl].c; 
t. data[kl+1].d=t.data[kl1].d; 





y 








t. data[k] .r==i;t.data[k].c=j;t.data[k].d 二 x; // 插 入 非 0 元 素 x Hesse 
t. nums 十 十 ; // 非 0 元 素 个 数 增 1 

} 

return true; // 成 功 操作 后 返回 真 


} 


3 将 指定 位 置 的 元 素 值 贼 给 变量 


该 运算 就 是 对 于 稀 朴 矩阵 4 执行 z 二 A[ 让 [7], 即 提取 A 中 指定 下 标的 元 素 值 。 先 在 三 
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元 组 顺序 表 1 中 查找 指定 的 位 置 , 若 找到 了 ,说明 是 一 个 非 零 元 素 ,将 其 值 赋 给 x; 否则 说 明 
是 零 元 素 , 置 z= 二 0。 算 法 如 下 : 





bool Assign(TSMatrix t, ElemType &x, int i,int j) 


{ intk=0; 

if (i>=t.rows || j>=t.cols) // 参 数 超 界 
return false; // 返 回 假 

while (k<t.nums &-&i>t.data[k].r) k 十 十  // 查 找 第 i 行 

while (k< t.nums &&i==t.data[k].r && j>t.data[k].c) 
EF // 在 第 i 行 的 非 0 元 素 中 查找 第 j 列 

if (t. data[k] .r==i && t.data[k] .c==j) // 车 存在 这 样 的 非 0 元 素 
x=t. data[k] .d; // 提 取 元 素 值 

else // 若 不 存在 这 样 的 非 0 元 素 
x=0; // 置 x 为 0 

return true; // 成 功 操作 后 返回 真 


该 运算 从 头 到 尾 扫描 三 元 组 顺序 表 14, 依次 输出 元 素 值 。 算 法 如 下 : 


void DispMat( TSMatrix t) 





{ intk; 
if (t.nums <=0) // 没 有 非 零 元 素 时 直接 返回 
return; 
printf("\t%d\t%d\t% d\n", t. rows, t. cols, t. nums); 
printf("\t Nn 


for (k= 二 0;k<t.nums;k 十 十 ) ”// 输 出 所 有 非 0 元 素 
printf("\t%d\t%d\t% d\n", t. data[k] .r,t. data[k].c, t. data[k] .d); 
} 


和 

该 运算 对 于 一 个 mXn 的 稀 朴 矩阵 A。x, , 求 其 转 置 矩阵 B,xw 即 65; 二 aj.i, 其 中 0<i< 
m 一 1,0j 三 n 一 1。 采 用 的 算法 思路 是 A 对 应 的 三 元 组 顺序 表 为 4, 其 转 置 矩 阵 B 对 应 的 三 
元 组 顺序 表 为 也 。 按 v 二 0,1,…,i. cols 在 1 中 找 列 号 为 v 的 元 素 , 每 找到 一 个 这 样 的 元 素 ， 
将 行 、 列 交换 后 添加 到 tb 中 。 算 法 如 下 : 


void TranTat(TSMatrix t, TSMatrix &tb) 





{intk,kl=0,v; //k1 记录 tb 中 的 元 素 个 数 
tb.rows 一 t.colsitb.cols 一 t.rowsitb.nums 一 t.nums; 
if (t.nums! 一 0) // 当 存在 非 零 元 素 时 执行 转 置 
{ for (v 一 0;v<t.colsiv 十 十 ) // 按 v=0、1、… \t.cols 循环 
for (k=0;k<t.nums;k++ 十 ) //k 用 于 扫描 t.data 的 所 有 元 素 
if (t.data[k] .c==v) // 找 到 一 个 列 号 为 v 的 元 素 
{ tb.data[kl].r=t.data[k].c; // 将 行 、 列 交换 后 添加 到 tb 中 


tb. data[kl] .c=t. data[k].r; 
tb. data[k1] .d=t. data[k].d; 
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El // 也 中 元 素 的 个 数 增 1 


} 


以 上 算法 中 含有 两 重 for 循环 ,其 时 间 复 杂 度 为 O(z. cols X1. nums)。 最 坏 的 情况 是 当 
稀疏 矩阵 中 的 非 零 元素 个 数 4. nums 和 m Xn 同 数量 级 时 ,时 间 复 杂 度 为 OC(mXn?), 所 以 这 
不 是 一 种 高 效 的 算法 。 

从 以 上 可 以 看 出 , 稀 朴 矩阵 采用 三 元 组 顺序 表 存 储 后 , 当 非 零 元 素 个 数 较 少 时 会 在 一 定 
程度 上 节省 存储 空间 。 如 果 用 一 个 二 维 数组 直接 存储 稀 朴 矩阵 ,此 时 具有 随机 存 取 特 性 ,但 
采用 三 元 组 顺序 表 存 储 后 会 丧失 随机 存 取 特 性 。 


622 稀疏 矩阵 的 十 字 链 表 表 示 


十 字 链 表 (orthogonal list) 是 稀 政 矩阵 的 一 种 链 式 存储 结构 (相应 的 ,前 面 的 三 元 组 顺 
序 表 是 稀 朴 矩阵 的 一 种 顺序 存储 结构 )。 有 如 下 3 行 4 列 的 稀疏 和 矩阵: 
| 0 4 


创建 稀 玻 矩阵 B 的 十 字 链 表 的 步骤 如 下 : 

(1) 对 于 稀 朴 矩阵 中 每 个 非 零 元 素 创 建 一 个 结 点 存放 它 ,包含 元 素 的 行 号 、 列 号 和 元 素 
值 。 这 里 有 4 个 非 零 元 素 ,创建 4 个 数据 结 点 。 

(2) 将 同一 行 的 所 有 结 点 构成 一 个 带头 结 点 的 循环 单 链表 , 行 号 为 i 的 扫 - 扫 
单 链表 的 头 结 点 为 hr[ 门 。 这 里 有 3 行 ,对 应 有 3 个 循环 单 链表 , 头 结 点 分 
别 为 hr[0] 一 hr[2]。hr[ 疏 (0 志 i 二 2) 头 结 点 的 行 指针 指向 行 号 为 i 的 单 链 
表 的 首 结 点 。 Th 

(3) 将 同一 列 的 所 有 结 点 构成 一 个 带头 结 点 的 循环 单 链表 , 列 号 为 j 视频 讲解 
的 单 链表 的 头 结 点 为 hd[j] 。 这 里 有 4 列 , 对 应 有 4 个 循环 单 链表 , 头 结 
点 分 别 为 hd[0] 一 hd[3j]。hd[j](0 志 7 三 3) 头 结 点 的 列 指针 指向 列 号 为 j 的 单 链表 的 首 

由 此 创建 了 3 十 4 二 7 个 循环 单 链表 , 头 结 点 的 个 数 也 为 7 个。 实际 上 ,可 以 将 hr[ 让 和 
hd[ 避 合 起 来 变 为 [ 门 , 即 风 匡 同时 包含 有 行 指针 和 列 指针 。AL 庙 (0 入 i 委 2) 头 结 点 的 行 指 
针 指 向 行 号 为 i 的 单 链表 的 首 结 点 ,h[i](0 三 i 三 3) 头 结 点 的 列 指针 指向 列 号 为 i 的 单 链表 




















的 首 结 点 ,这样 头 结 点 的 个 数 为 MAX{3,4} 一 4 个 。 人 


(4) 再 将 所 有 头 结 点 h[i(0<i<3) 连 起 来 构成 一 个 带头 结 点 的 循环 单 链表 ,这 样 需要 
增加 一 个 总 头 结 点 hm, 总 头 结 点 中 存放 稀疏 矩阵 的 行 数 和 列 数 等 信息 。 

采用 上 述 过 程 创 建 的 稀 玻 矩阵 瑟 的 十 字 链 表 如 图 6. 8 所 示 。 每 个 非 零 元 素 就 好 比 在 
一 个 十 字 路 口 ,由 此 称 为 十 字 链 表 。 

在 稀 朴 矩阵 的 十 字 链 表 中 包含 两 种 类 型 的 结 点 ,一 种 是 存放 非 零 元 素 的 数据 结 点 ,其 结 
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图 6.8 一 个 稀疏 矩阵 的 十 字 链 表 


构 如 图 6. 9(a) 所 示 ; 另 一 种 是 头 结 点 ,其 结构 如 图 6.9(b) 所 示 。 






































Tow col value row col link 
down right down right 
(a) 数据 结 点 结构 (b) 头 结 点 结构 


图 6.9 十 字 链 表 的 结 点 结构 


为 了 方便 算法 设计 ,将 两 种 类 型 的 结 点 统一 起 来 ,设计 稀 牙 矩阵 的 十 字 链 表 的 结 点 类 型 


MatNode 如 下 : 
# define M < 稀 朴 矩阵 行 数 > 
# define N < 稀疏 和 矩阵 列 数 > 
# define Max ((M)>(N)?(M):(N)) // 矩 阵 行列 较 大 者 
typedef struct mtxn 
{ introw; // 行 号 或 者 行 数 
int col; // 列 号 或 者 列 数 
struct mtxn * right, * down; // 行 、 列 指针 
union 
{ ElemType value; // 非 零 元 素 值 
struct mtxn * link; // 指 向 下 一 个 头 结 点 
} tag; 
} MatNode; // 十 字 链 表 的 结 点 类 型 


从 中 可 以 看 出 ,在 十 字 链 表 中 行 、 列 头 结 点 是 共享 的 ,而 且 采 用 头 结 点 数组 存储 ,通过 头 
结 点 h[ 门 的 有 [ 疏 一 > right 指针 可 以 逐 行 搜索 行 下 标 为 i 的 所 有 非 零 元 素 ,h[ 让 一 > down 指 
针 可 以 逐 列 搜索 列 下 标 为 i 的 所 有 非 零 元 素 。 每 一 个 非 零 元 素 同 时 包含 在 两 个 链表 中 , 方 


@O EEE 





便 算法 中 行 方向 和 列 方向 的 搜索 ,因而 大 大 降低 了 算法 的 时 间 复 杂 度 。 


对 于 一 个 痉 Xz 的 稀 朴 矩阵 ,总 的 头 结 点 个 数 为 MAX{m,n}) 十 1。 
由 于 稀 牙 矩阵 十 字 链 表 的 运算 算法 设计 比较 复杂 ,这 里 不 再 袭 述 。 
【 例 6.2】 设计 一 个 用 于 存储 双 层 集合 的 存储 结构 ,所谓 双 层 集合 是 指 这 样 的 集合 ,: 


中 每 个 元 素 又 是 一 个 集合 ( 称 为 集合 元 素 ), 该 集合 元 素 由 普通 的 整数 元 素 构 成 。 例 如 5S 二 


{41,3),{1 


采用 类 似 于 十 字 链 表 的 思路 ,将 每 个 集合 元 素 设计 成 带头 结 点 的 单 链表 ,将 这 些 集 
合 元 素 头 结 点 串 起 来 构成 一 个 单 链表 ,设置 h 所 指 的 结 点 作为 集合 头 结 点 ,如 图 6. 10 所 示 。 


,7,8},{5,6}}。 


















































集合 头 结 点 
[A 
上 了 和 ] 
集合 元 素 头 结 生硬 和 匡 忆 | 


图 6.10 双 层 集合 的 存储 结构 


数据 结 点 的 类 型 声明 如 下 : 


typedef struct dnode 
{ int data; 

struct dnode * next; 
} DType; 


e 合 本 


E 素 头 结 点 的 类 型 声明 如 下 : 


typedef struct hnode 
{ DType * next; 
struct hnode * link; 


} HType; 


集合 头 结 点 的 类 型 与 集合 元 素 头 结 点 的 类 型 相同 。 


631 广义 表 的 定义 


广义 表 (generalized table) 是 线性 表 的 推广 ,是 有 限 个 元 素 的 序列 ,其 逻 


辑 结构 采 月 
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GL 王 (al az，… ai 
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其 中 表示 广义 表 的 长 度 , 即 广义 表 中 所 含 元 素 的 个 数 ,n 宇 90。 车 n 二 0, 称 为 空 表 。a; 为 广 
义 表 的 第 i 个 元 素 , 如 果 a; 属于 原子 类 型 (原子 类 型 的 值 是 不 可 分 解 的 ,如 C/C++ 语言 中 的 
整 型 . 实 型 和 字符 型 等 ), 称 为 广义 表 GL 的 原子 (atom); 如 果 a; 又 是 一 个 广义 表 , 称 为 广义 
表 GL 的 子 表 (subgeneralized table) 。 

广义 表 具 有 以 下 重要 的 特性 : 

(1) 广义 表 中 的 数据 元 素 是 有 相对 次 序 的 。 

(2) 广义 表 的 长 度 定义 为 最 外 层 包 含 元 素 的 个 数 。 

(3) 广义 表 的 深度 定义 为 所 含 括 弧 的 重 数 ,其 中 原子 的 深度 为 0, 空 表 的 深度 为 1。 

(4) 广义 表 可 以 共享 ,一 个 广义 表 可 以 被 其 他 广义 表 共 享 ,这 种 共享 广义 表 称 为 再 
入 表 。 

(5) 广义 表 可 以 是 一 个 递归 的 表 , 一 个 广义 表 可 以 是 自己 的 子 表 , 这 种 广义 表 称 为 递归 
表 。 递 归 表 的 深度 是 无 穷 值 ,而 长 度 是 有 限 值 。 

广义 表 抽 象 数据 类 型 的 定义 如 下 : 


ADT Glist 
{ ”数据 对 象 : 
D={ e| 1<i<n, n>0,ei € AtomSet 或 e, € GList, AtomSet 为 某 个 数据 对 象 } 
数据 关系 : 
R={<e@-1,e> | ee ED,2<i<n)} 
基本 运算 : 
CreateGL(s) : 创建 广义 表 g, 由 括号 表示 法 ;创建 并 返回 一 个 广义 表 ; 
DestroyGL( &g): 销毁 广义 表 , 释 放 广义 表 g 的 存储 空间 ; 
GLLength(g): 求 广义 表 g 的 长 度 ; 
GLDepth(g): 求 广义 表 g 的 深度 ; 
DispGL(g): 输出 广义 表 g. 
} 


为 了 简单 起 见 , 下 面 讨论 的 广义 表 不 包括 前 面 定义 的 再 入 表 和 递归 表 , 即 只 讨论 一 般 的 
广义 表 。 另 外 ,规定 用 小 写字 母 表示 原子 ,用 大 写字 母 表 示 广 义 表 的 表 名 。 例 如 : 
A=() 
B=(e) 
C=(a,(b,c,d)) 
D=(A,B,C)=((),(e),(a,(b,c,d))) 
E=((a,(a,b),((a,b),c))) 
其 中 : 
A 是 一 个 空 表 , 其 长 度 为 0; 
B 是 一 个 只 含有 单个 原子 e 的 表 , 其 长 度 为 1; 
C 中 有 两 个 元 素 , 一 个 是 原子 , 另 一 个 是 子 表 ,C 的 长 度 为 2; 
D 中 有 3 个 元 素 ,每 个 元 素 又 都 是 一 个 子 表 ,D 的 长 度 为 3; 
屯 中 只 含有 一 个 元 素 ,该 元 素 是 一 个 子 表 ,E 的 长 度 为 1。 
如 果 把 每 个 表 的 名 称 ( 若 有 ) 写 在 其 表 的 前 面 (没有 给 出 名 称 的 子 表 为 匿名 表 , 用 ”。" 表 


所 OO 生生 





示 ), 则 上 面 的 5 个 广义 表 可 相应 地 表示 如 下 : 
AGO) 
Ble) 
Cla, »* (b,c,d)) 
D(AQO,B(e),.C(a, * (b,c,d))) 
E(» (a,* (a,b),* (* (a,b),c))) 
车 用 圆圈 和 方 框 分 别 表示 表 和 原子 ,并 用 线段 把 表 和 它 的 元 素 ( 元 素 结 点 应 在 其 表 结 点 
的 下 方 ) 连 接 起 来 , 则 可 得 到 一 个 广义 表 的 图 形 表示 。 例 如 ,上 面 5 个 广义 表 的 图 形 表示 如 
图 6.11 所 示 。 
4 B 已 
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图 6.11 广义 表 的 图 形 表示 


广义 表 GL 的 表 头 为 第 一 个 元 素 ai ,其 余部 分 (as，…,a;，,…,a,) 为 GL 的 表 尾 ,分 别 记 
作 head(CGL)=a 和 tail(GL) 一 (aa ,aa)。 显 然 , 一 个 广义 表 的 表 尾 始终 是 一 个 广 
义 表 。 空 表 无 表 头 、 表 尾 。 这 里 仍 取 上 面 的 示例 : 
A 无 表 头 、 表 尾 
head(B)=e; tail(B)= 0) 
head(C)=a; tail(C)=((b,c,d)) 
head(D)=0O; tail(D)=((e),(a,(b,c,d))) 
head(E)=(a,(a,.b),((a,b),c)); tal(E)=() 
其 中 ,广义 表 A 和 B 的 深度 为 1( 注 意 广 义 表 A 和 广义 表 B 的 深度 相同 ,因为 它们 均 只 有 一 
重 括号 ) ,广义 表 C.D\E 的 深度 分 别 为 2.3 和 4。 


632 广义 表 的 存储 结构 


广义 表 是 一 种 递归 的 数据 结构 ,因此 很 难为 每 个 广义 表 分 配 固定 大 小 
的 存储 空间 ,所 以 其 存储 结构 只 好 采用 链 式 存储 结构 。 











从 图 6. 11 中 可 以 看 到 ,广义 表 有 两 类 结 点 ,一 类 为 圆圈 结 点 ,在 这 里 对 应 子 表 ; 另 一 类 sa 


为 方形 结 点 ,在 这 里 对 应 原子 。 
为 了 使 子 表 和 原子 两 类 结 点 既 能 在 形式 上 保持 一 致 ,又 能 进行 区 别 ,可 采用 以 下 结构 
形式 : 





tag sublist/data link 




















其 中 ,tag 域 为 标志 字段 ,用 于 区 分 两 类 结 点 , 即 由 tag 决定 是 使 用 结 点 的 sublist 还 是 
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data 域 : 

(1) 若 tag 一 0, 表 示 该 结 点 为 原子 结 点 , 则 第 2 个 域 为 data, 存 放 相 应 原子 元 素 的 信息 ; 

(2) 车 tag 一 1, 表 示 该 结 点 为 表 / 子 表 结 点 , 则 第 2 个 域 为 sublist, 存 放 相 应 表 / 子 表 中 
第 一 个 元 素 对 应 结 点 的 地 址 。 

link 域 存放 同一 层 的 下 一 个 元 素 对 应 结 点 (兄弟 结 点 ) 的 地 址 , 当 没 有 兄弟 结 点 时 ,其 
link 域 为 NULL。 


例如 ,前 面 的 广义 表 C 的 链 式 存储 结构 如 图 6. 12 所 示 。 


ee 
0|a 
0o|b| +={ofe| 十 -old 和 


图 6.12 广义 表 C 的 存储 结构 















































采用 C/C++ 语言 描述 广义 表 的 结 点 类 型 GLNode, 其 声明 如 下 : 


typedef struct lnode 


{ int tag; // 结 点 类 型 标识 
union 
{ ElemType data; // 存 放 原子 值 
struct lnode * sublist; // 指 向 子 表 的 指针 
} val; 
struct lnode * link; // 指 向 下 一 个 元 素 
} GLNode; // 广 义 表 的 结 点 类 型 


633 广义 表 的 运算 
为 了 使 算法 方便 ,在 广义 表 的 逻辑 表示 中 用 *( #)" 表 示 空 表 。 
生产 允 表 而 竺 天语 证 字 英 





在 广义 表 的 链 式 存储 结构 中 ,tag=1 的 结 点 可 以 看 成 是 一 个 单 链 表 的 头 结 点 ,由 
sublist 域 指向 它 的 所 有 元 素 构成 的 单 链表 的 首 结 点 ,link 域 指向 它 的 兄弟 结 点 。 从 中 可 以 
看 到 ,广义 表 的 链 式 存储 结构 具有 递归 性 ,可 以 从 两 个 方面 来 理解 这 种 递归 性 ,从 而 得 到 广 
义 表 的 两 种 递归 算法 方法 。 

解法 1: 一 个 非 空 广义 表 的 基本 存储 结构 如 图 6. 13 所 示 ,将 其 看 成 是 带头 结 点 的 单 链 

站 这 2 











一 个 带头 结 点 的 广义 表 
第 1 个 元 素 | 筷 2 个 元 素 第 nn 个 元 素 


| 人 ^] 子 表 的 头 结 点 : 子 表 可 以 看 成 
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* -| 1 
上 1 
| 浅 子 表 结构 和 广义 表 结构 是 相似 的 


图 6.13 一 个 非 空 广义 表 的 基本 存储 结构 
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表 , 对 于 原子 结 点 ,可 以 直接 进行 处 理 以 实现 原子 操作 ; 对 于 子 表 结 点 ,由 于 子 表 的 存储 结 
构 和 整个 广义 表 的 存储 结构 是 相似 的 ,因此 子 表 的 处 理 和 整个 广义 表 的 处 理 是 相似 的 。 从 
这 个 角度 出 发 设计 求解 广义 表 递 归 算 法 的 一 般 格式 如 下 : 


void funl (GLNode * g) //g 为 广义 表 头 结 点 指针 
{ GLNode * gl=g—>val.sublist; //gl 指向 第 一 个 元 素 
while (gl!= NULL) // 元 素 未 处 理 完 循环 











{ if(gl > tag==1) // 为 子 表 时 ; 
:funl(gD); // 递 归 处 理子 表 ; 
‘else // 为 原子 时 : 先 处 理 一 个 元 素 
: ”原子 处 理 语句 ; ， 










再 处 理 后 继 元 素 


} 


解法 2: 一 个 非 空 广义 表 存 储 结构 中 两 类 结 点 的 基本 结构 如 图 6. 14 所 示 。 每 个 原子 结 
点 的 data 域 为 原子 值 ,link 域 指向 其 兄弟 ; 每 个 表 / 子 表 结 点 的 sublist 指向 它 的 元 素 , link 
指向 兄弟 。 因 此 ,对 于 原子 结 点 ,其 兄弟 的 处 理 与 整个 广义 表 的 处 理 是 相似 的 ; 对 于 表 / 子 
表 结 点 ,其 元 素 和 兄弟 的 处 理 与 整个 广义 表 的 处 理 是 相似 的 。 


广义 表 的 一 个 结 点 一- 一 ~ 

































































广义 表 的 一 个 结 点 /8 的 兄弟 \ 
9 一 个 结 点 “一 ES & 习 二 ua 
1 jg 的 兄弟 、 | 
Es | } | ee 
/ 
a i = 
“|* | | * 
原子 值 
`、、 g 的 元 素 
(a) 广义 表 原 子 结 点 (b) 广义 表 / 子 表 结 点 


图 6.14 广义 表 中 两 类 结 点 的 基本 结构 


从 这 个 角度 出 发 设计 求解 广义 表 递 归 算 法 的 一 般 格式 如 下 : 











void fun2(GLNode * g) //g 为 广义 表 结 点 指针 
{ if(g!=NULL) 
{ if (gtag==1) // 为 子 表 时 
; fun2(g -> val. sublist); // 递 归 处 理 其 元 素 ; 
‘else // 为 原子 时 一 一 先 处 理 data/ sublist 域 , 即 元 素 部 分 
原子 处 理 语句 ; // 实 现 原子 操作 





一 一 再 处 理 link 域 , 即 兄弟 部 分 


} 
在 实际 应 用 中 可 以 根据 求解 问题 的 特点 选择 其 中 一 种 解法 来 设计 递归 算法 。 








2 未 多 表 的 天良 

在 广义 表 中 ,同一 层次 的 每 个 结 点 是 通过 link 域 链接 起 来 的 ,将 其 看 成 
是 带头 结 点 的 单 链表 ,如 图 6. 13 所 示 , 这 样 求 广 义 表 的 长 度 就 是 求 单 链表 
的 长 度 。 对 应 的 非 递归 算法 如 下 : 














视频 讲解 
int GLLength(GLNode * g) // 求 广义 表 g 的 长 度 
{ intn=0; // 累 计 元 素 个 数 ,初始 值 为 0 

GLNode * gl; 

gl=g—> val. sublist; //g1l 指向 广义 表 的 第 一 个 元 素 

while (gl!=NULL) // 扫 描 所 有 元 素 结 点 

| // 元 素 个 数 增 1 

gl 一 gl 一 link; 
} 
return ni // 返 回 元 素 个 数 


} 


3 求 广义 表 的 深 阳 


对 于 广义 表 g ,其 深度 等 于 所 有 元 素 的 最 大 深度 加 1。 若 g 为 原子 ,其 深度 为 0, 求 广义 


表 深 度 的 递归 模型 /(g) 如 下 : 
人 车 g 为 原子 
Fel 车 g 为 空 表 
WY MAR {fsubg)} +t1 其 他 情况 


求 广 义 表 g 的 深度 的 算法 如 下 : 


int GLDepth(GLNode * g) // 求 广义 表 g 的 深度 
{ GLNode x gl; 
int maxd=0, dep; 





if (g ->tag==0) // 为 原子 时 返回 0 
return 0; 
gl=g—> val. sublist; //gl 指向 第 一 个 元 素 
if (gl== NULL) // 为 空 表 时 返回 1 
return 1; 
while (gl!= NULL) // 遍 有 历 表 中 的 每 一 个 元 素 
{ if(gl—>tag==1) // 元 素 为 子 表 的 情况 
{ dep=GLDepth(g1); // 递 归 调 用 求 出 子 表 的 深度 
if (dep> maxd) //maxd 为 同一 层 的 子 表 中 深度 的 最 大 值 
maxd= dep; 
} 
gl=g] —> link; // 使 gl 指向 下 一 个 元 素 
} 
return(maxd 十 1); // 返 回 表 的 深度 


} 


实际 上 ,本 算法 是 采用 前 面 介绍 的 广义 表 算 法 设计 方法 中 的 解法 1 实现 的 。 
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输出 广义 表 g 的 过 程 /(g) 为 ,车 g 不 为 NULL, 先 输出 g 的 元 素 , 当 有 兄弟 时 再 输出 
兄弟 。 输 出 g 的 元 素 的 过 程 是 ,如 果 该 元 素 为 原子 , 则 直接 输出 原子 值 , 若 为 子 表 , 输 出 《 
如 果 为 空 表 则 输出 '# “如 果 为 非 空子 表 则 递归 调用 Cg 一 > val sublisb 以 输出 子 表 , 再 输 
出 9 ,输出 g 的 兄弟 的 过 程 是 输出 '， "递归 调用 /Cg 一 > linl) 以 输出 兄弟 。 

输出 一 个 广义 表 的 算法 如 下 。 


void DispGL(GLNode * g) // 输 出 广义 表 g 
{ ii(g!=NULL) // 表 不 为 空 判断 
{ if(g->tag==0) //g 的 元 素 为 原子 时 
printf("%c"，g 一 > val. data) ; // 输 出 原子 值 
else //g 的 元 素 为 子 表 时 
€ print("C")s // 输 出 '(" 
if (g—> val. sublist== NULL) // 为 空 表 时 
printf("#"); 
else // 为 非 空 子 表 时 
DispGL(g —> val. sublist) ; // 递 归 输出 子 表 
printf(")"); // 输 出 )' 


} 
if (g—> link!=NULL) 
{pilnt(™, "Ys 
DispGLCg -> link); // 递 归 输出 g 的 兄弟 
} 


. 


实际 上 ,本 算法 是 采用 前 面 介绍 的 广义 表 算 法 设计 方法 中 的 解法 2 实现 的 。 

假设 广义 表 的 逻辑 结构 采用 括号 表示 ,其 中 的 元 素 类 型 ElemType 为 
char 类 型 ,每 个 原子 的 值 被 限定 为 单个 英文 字母 。 其 格式 为 元 素 之 间 用 一 
个 逗号 分 隔 , 表 元 素 的 起 止 符号 分 别 为 左 、 右 圆 括 号 , 空 表 为 "(#)"。 例 如 
"(a,(b,c,d),( 井 ))" 就 是 一 个 符合 上 述 规定 的 广义 表格 式 。 i 

建立 广义 表 链 式 存储 结构 的 算法 是 一 个 递归 算法 , 它 使 用 一 个 广义 表 括 号 表示 字符 串 
参数 ,返回 创建 的 广义 表 链 式 存储 结构 的 头 结 点 指针 g。 

算法 的 执行 过 程 是 从 头 到 尾 扫描 * 的 每 一 个 字符 。 当 遇 到 “ 时 ,表明 它 是 一 个 表 / 子 表 
的 开始 ,应 创建 一 个 由 g 指向 的 表 / 子 表 结 点 ,并 用 它 的 sublist 域 作 为 子 表 的 表 头 指针 进行 




















递归 调用 来 建立 子 表 的 存储 结构 ; 当 遇 到 一 个 英文 字母 时 ,表明 它 是 一 个 原子 , 则 应 创建 一 mm 


个 由 有 指向 的 原子 结 点 ; 当 遇 到 一 个 ) 字符 时 ,表明 前 面 的 表 / 子 表 已 处 理 完毕 , 则 将 g 置 
为 空 ; 当 遇 到 一 个 '# 字符 时 ,表明 前 面 的 表 / 子 表 是 空 表 , 则 将 g 一 > val. sublist 置 为 空 。 
当 建 立 了 一 个 由 h 指向 的 结 点 后 ,接着 遇 到 ', 时 ,表明 还 存在 兄弟 ,需要 建立 当前 结 点 
( 即 由 g 指向 的 结 点 ) 的 兄弟 结 点 ; 否则 表明 当前 结 点 没有 兄弟 了 ,将 当前 结 点 的 link 域 置 
为 空 。 
根据 以 上 分 析 , 设 计 对 应 的 生成 广义 表 链 式 存储 结构 的 算法 如 下 : 
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GLNode * CreateGL(char * &s) 
{ GLNode * g; 

char ch 一 * s 十 十 ; 

if (ch!="\0') 


{ g=(GLNode * )malloc(sizeof(GLNode)); 


ff (ch=="(') 
{ g—>tag=1; 


g 一 > val. sublist= CreateGL(s); 


} 
else if (ch== ")") 
g=NULL; 
else if (ch=='#') 
g=NULL; 
else 
{ g—>tag=0; 
g—>val.data=ch; 
} 
} 
else 
g=NULL; 
ch 一 * s 十 十 ; 
if (g!= NULL) 
if (ch=="," 
g 一 > link= CreateGL(s); 
else 
g—>link=NULL; 
return g; 


} 


// 返 回 由 括号 表示 s 建立 的 广义 表 链 式 存储 结构 


// 取 一 个 字符 

// 若 s 未 扫描 完 

// 创 建 一 个 新 结 点 

// 当 前 字符 为 左 括号 时 

// 新 结 点 作为 表 / 表 头 结 点 

// 递 归 构造 子 表 并 链接 到 表 头 结 点 


// 遇 到 ')' 字 符 ,g 置 为 空 
// 遇 到 '# ' 字 符 ,表示 空 表 


// 为 原子 字符 
// 新 结 点 作为 原子 结 点 


// 若 s 扫 描 完 ,g 置 为 空 


// 取 下 一 个 字符 

//s 未 扫描 完 ,继续 构造 兄弟 结 点 

// 当 前 字符 为 ',' 

// 递 归 构造 兄弟 结 点 

// 没 有 兄弟 了 ,将 兄弟 指针 置 为 NULL 


// 返 回 广义 表 g 


该 算法 需要 扫描 输入 广义 表 括 号 表示 中 的 所 有 字符 ,所 以 算法 的 时 间 复 杂 度 为 O(n) ,n 
表示 广义 表 中 所 有 字符 的 个 数 。 在 这 个 算法 中 既 包 含 子 表 的 递归 调用 ,也 包含 兄弟 的 递归 
调用 ,所 以 递归 调用 的 最 大 深度 不 会 超过 生成 的 广义 表 中 所 有 结 点 的 个 数 , 因 而 其 空间 复杂 


度 也 为 O(n)。 


ER 一 

该 运算 扫描 广义 表 链 式 存储 结构 g 的 所 有 结 点 并 逐个 释放 。 将 广义 表 & 看 成 是 带头 
结 点 的 单 链表 ,扫描 & 的 所 有 元 素 结 点 ,如 果 为 原子 结 点 ,直接 释放 ， 如 果 为 子 表 结 点 ,释放 
该 子 表 的 过 程 与 整个 广义 表 是 相似 的 。 对 应 的 递归 算法 如 下 ， 


void DestroyGL(GLNode * &-g) 
{ GLNode *g],* g2; 
gl=g—> val. sublist; 
while (gl!= NULL) 
{ if(gl—>tag==0) 
{  g2—gl -> link; 
free(g1); 
gl=g2; 
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// 销 毁 广义 表 g 


//g1 指向 广义 表 的 第 一 个 元 素 
// 遍 历 所 有 元 素 

// 若 为 原子 结 点 

//g2 临时 保存 兄弟 结 点 

// 释 放 gl 所 指 的 原子 结 点 
//g1 指向 后 继 兄弟 结 点 


} 
else 
{ g2=g] 一 link; 
DestroyGL(g1); 
gl=g2; 
} 
} 
free(g); 
} 


实际 上 ,本 算法 是 采用 前 面 介绍 的 广义 表 算 法 设计 方法 中 的 解法 1 实 
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// 若 为 子 表 

//g2 临时 保存 兄弟 结 点 
// 递 归 释 放 gl 所 指 子 表 的 空间 
//g1l 指向 后 继 兄 弟 结 点 


// 释 放 头 结 点 空间 

















现 的 。 
【 例 6.3】 对 于 采用 链 式 存储 结构 的 广义 表 g 设计 一 个 算法 求 原子 个 数 。 
需要 扫描 广义 表 g 中 的 所 有 结 点 ,可 以 采用 前 面 介绍 的 广义 表 算 法 : 
设计 方法 中 的 两 种 解法 来 实现 。 对 应 的 算法 如 下 ， Wi 
// 采 用 解法 1 的 方法 
int Countl(GLNode * g) // 求 广义 表 g 的 原子 个 数 
{ intn=0; 
GLNode * gl=g—> val. sublist; 
while (gl!= NULL) // 对 每 个 元 素 进行 循环 处 理 
{ if(gl—>tag==0) // 为 原子 时 
i // 原 子 个 数 增 1 
else // 为 子 表 时 
n 十 一 Countl(g1) ; // 累 加 元 素 的 原子 个 数 
g1 一 gl -> link; // 累 加 兄弟 的 原子 个 数 
} 
return n; // 返 回 总 原子 个 数 
} 
// 采 用 解法 2 的 方法 
int Count2(GLNode * g) // 求 广义 表 g 的 原子 个 数 
{ intn=0; 
if (g!=NULL) // 对 每 个 元 素 进行 循环 处 理 
{ if(g—>tag==0) // 为 原子 时 
站 // 原 子 个 数 增 1 
else // 为 子 表 时 
n 十 一 Count2(g 一 > val.sublist) ; // 累 加 元 素 的 原子 个 数 
n 十 一 Count2(g —> link); // 累 加 兄弟 的 原子 个 数 
} 
return n; // 返 回 总 原子 个 数 
} 
二 本章 小 结 一 < 一 
本 章 的 基本 学 习 要 点 如 下 : 


(1) 理解 数组 和 一 般 线性 表 之 间 的 异同 








= 视频 讲解 
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掌握 数组 的 顺序 存储 结构 和 元 素 地 址 计算 方法 。 

(3) 掌握 各 种 特殊 矩阵 (如 对 称 甜 阵 . 上 /下 三 角 矩 阵 和 对 角 和 矩阵 ) 的 压缩 存储 方法 。 
(4) 掌握 稀疏 矩阵 的 各 种 存储 结构 及 其 特点 。 

(5) 掌握 广义 表 的 递归 特性 和 存储 结构 设计 。 

(6) 掌握 广义 表 的 相关 算法 设计 方法 。 

(7) 综合 运用 数组 和 广义 表 解 决 一 些 复杂 的 实际 问题 。 


一 练习 题 6 一 一 ~ 


1. 如 何 理解 数组 是 线性 表 的 推广 ? 

2. 有 三 维 数组 a[0..7,0..8,0..9] 采 用 按 行 序 优先 存储 ,数组 的 起 始 地 址 是 1000 ,每 个 
元 素 占用 两 个 字 节 , 试 给 出 下 面 结 果 : 

(1) 元 素 ass 的 起 始 地 址 。 

(2) 数组 a 所 占用 的 存储 空间 。 

3. 如 果 某 个 一 维 数组 A 的 元 素 个 数 n 很 大 ,存在 大 量 重复 的 元 素 , 且 所 有 元 素 值 相同 
的 元 素 紧 挨 在 一 起 ,请 设计 一 种 压缩 存储 方式 使 得 存储 空间 更 节省 。 

4. 一 个 nn 阶 对 称 和 矩阵 A 采用 压缩 存储 在 一 维 数组 B 中 , 则 B 中 包含 多 少 个 元 素 ? 

5. 设 nXn 的 上 三 角 矩 阵 A[0..n 一 1,0..n 一 1] 已 压缩 到 一 维 数组 BL0..m]j 中 ,车 按 列 为 
主 序 存储 , 则 A[ 门 [站 对 应 的 B 中 存储 位 置 k 为 多 少 ? 给 出 推导 过 程 。 

6. 利用 三 元 组 存储 任意 稀 朴 数组 A .假设 其 中 一 个 元 素 和 一 个 整数 占用 的 存储 空间 相 
同 , 问 在 什么 条 件 下 才能 节省 存储 空间 ? 

7. 用 十 字 链 表 存 储 一 个 有 k 个 非 0 元 素 的 mXn 的 稀 朴 矩阵 , 则 其 总 的 结 点 数 为 多 少 ? 

8. 求 下 列 广义 表 运 算 的 结果 。 

(1) head[ (x,y,z)] 

(2) tail[ (Ca,b), (x,y))] 

注意 : 为 了 清楚 起 见 , 在 括号 层次 较 多 时 将 head 和 tail 的 参数 用 中 括号 表示 。 例 如 
head[Gj、tail[G] 分 别 表示 求 广义 表 G 的 表 头 和 表 尾 。 

9. 设 定 二 维 整 数 数组 B[0..m 一 1,0..n 一 1] 的 数据 在 行 、 列 方向 上 都 按 从 小 到 大 的 顺序 
排序 , 且 整 型 变量 z 中 的 数据 在 B 中 存在 。 设 计 一 个 算法 , 找 出 一 对 满足 B[][j]==z 的 i、 
7 值 ,要 求 比较 次 数 不 超 过 w 十 n。 

10. 设计 一 个 算法 ,计算 一 个 用 三 元 组 表 表示 的 稀疏 矩阵 的 对 角 线 元 素 之 和 。 

11. 设计 一 个 算法 Same(g1,g2) ,判断 两 个 广义 表 gl 和 g2 是 否 相 同 。 


一 > 上 机 实验 题 6 一 < 


驶 验证 性 实验 
实验 题 1 实现 稀 朴 矩阵 (采用 三 元 组 表示 ) 的 基本 运算 
目的 : 领会 稀 朴 矩阵 三 元 组 存储 结构 及 其 基本 算法 设计 。 
内 容 : 假设 nXn 的 稀 朴 矩阵 4 采用 三 元 组 表示 ,设计 一 个 程序 exp6-1. cpp 实现 以 下 
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功能 。 
(1) 生成 以 下 两 个 稀 朴 矩阵 的 三 元 组 c 和 6。 
0 3 0 0 0 
0 1 00 0 400 
0 0 1 0 00 10 
6 1 1 0002 
(2) 输出 a 转 置 矩 阵 的 三 元 组 


(3) 输出 a 十 5 的 三 元 组 。 
(4) 输出 aXx5b 的 三 元 组 。 


实验 题 2: 实现 广义 表 的 基本 运算 
目的 : 领会 广义 表 的 链 式 存储 结构 及 其 基本 算法 设计 。 
内 容 : 编写 一 个 程序 exp6-2. cpp, 实 现 广义 表 的 各 种 运算 ,并 在 此 基础 上 设计 一 个 主 程 
序 完 成 以 下 功能 。 
(1) 建立 广义 表 g ="(b,(b,a'( 志 ),d),((ayb),c,((#))))" 的 链 式 存储 结构 。 
(2) 输出 广义 表 g 的 长 度 。 
(3) 输出 广义 表 g 的 深度 。 
(4) 输出 广义 表 g 的 最 大 原子 。 
慌 设 计 性 实验 
实验 题 3: 求 5X5 阶 螺旋 方 阵 
目的 : 掌握 数组 算法 设计 。 
内 容 : 以 下 是 一 个 5X5 阶 螺旋 方 阵 ,编写 一 个 程序 exp6-3. cpp 输出 该 形式 的 nX 
n(n 三 10) 阶 方 阵 ( 按 顺 时 针 方向 旋 进 )。 
i 2 8 #45 
16 17 18 19 6 
15 ‘24 25 ‘20 7 
23 22 2 6 
入 12 Wy 


实验 题 4: 求 一 个 矩阵 的 马鞍 点 

目的 : 掌握 数组 算法 设计 。 

内 容 : 如 果 和 矩阵 4 中 存在 一 个 元 素 满足 以 下 条 件 , 即 A[ 门 [站 是 第 i 行 中 值 最 小 的 元 素 ， 
且 又 是 第 j 列 中 值 最 大 的 元 素 , 则 称 之 为 该 矩阵 的 一 个 马鞍 点 。 设 计 一 个 程序 exp6-2. cpp 计 





算出 mXn 的 矩阵 4 的 所 有 马鞍 点 。 (ms 


戎 综合 性 实验 

实验 题 5: 求 两 个 对 称 和 矩阵 之 和 与 乘积 

目的 : 掌握 对 称 和 矩阵 的 压缩 存储 方法 及 相关 算法 设计 。 

内 容 : 已 知 A 和 B 为 两 个 nXn 阶 的 对 称 和 矩阵 ,在 输入 时 ,对 称 和 矩阵 只 输入 下 三 角形 元 
素 , 存 人 一 维 数组 ,如 图 6. 15 所 示 ( 对 称 和 矩阵 M 存储 在 一 维 数组 A 中 ) ,设计 一 个 程序 
exp6-5. cpp 实现 以 下 功能 。 
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(1) 求 对 称 和 矩阵 4 和 B 的 和 。 
(2) 求 对 称 和 矩阵 4 和 B 的 乘积 。 





url 
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图 6.15 ”对称 矩阵 的 存储 转换 形式 
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在 前 面 介 绍 了 几 种 常用 的 线性 结构 , 本 章 讨论 树 形 结构 。 树 形 
结构 属于 非 线性 结构 , 常用 的 树 形 结构 有 树 和 二 叉 树 。 线性 结构 可 
以 表示 元 素 或 元 素 之 间 的 一 对 一 关系 , 而 在 树 形 结构 中 , 一 个 结 点 
可 以 与 多 个 结 点 相对 应 , 因此 能 够 表示 层次 结构 的 数据 。 

本 章 主要 讨论 树 和 二 叉 树 两 种 树 形 结构 的 基本 概念 和 相关 算法 
设计 。 
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711 树 的 定义 

树 (tree) 是 由 n(n 宇 0) 个 结 点 (或 元 素 ) 组 成 的 有 限 集合 ( 记 为 T)。 

如 果 * 一 0, 它 是 一 棵 空 树 , 这 是 树 的 特例 ; 

如 果 一 0, 这 并 个 结 点 中 有 且 仅 有 一 个 结 点 作为 树 的 根 结 点 ,简称 为 
根 (root) ,其 余 结 点 可 分 为 m(m 宇 0) 个 互 不 相交 的 有 限 集 Ti ,Ts ,…,T, ,其 中 每 个 子 集 本 
身 又 是 一 棵 符合 本 定义 的 树 , 称 为 根 结 点 的 子 树 (subtree) 。 

从 上 可 以 看 出 , 树 的 定义 是 递归 的 ,因为 在 树 的 定义 中 又 用 到 树 定义 。 它 刻 化 了 树 的 固 
有 特性 , 即 一 棵 树 由 若干 棵 互 不 相交 的 子 树 构成 ,而 子 树 又 由 更 小 的 若干 棵 子 树 构 成 。 

树 结构 常用 于 表示 具有 层次 关系 的 数据 。 树 的 抽象 数据 类 型 描述 如 下 : 
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ADT Tree 
{ 数据 对 象 : 
D={ai| 1 过 过 wx 过 0,a; 为 ElemType 类 型 } //ElemType 是 自 定义 类 型 标识 符 
数据 关系 : 


R={<aw,o> | ai,a; ED,1<i,j<n, 其 中 有 且 仅 有 一 个 结 点 没有 前 驱 结 点 ,其 余 每 个 结 点 
只 有 一 个 前 驱 结 点 ,但 可 以 有 零 个 或 多 个 后 继 结 点 } 
基本 运算 : 
InitTree(&&1) : 初始 化 树 , 造 一 棵 空 树 1. 
DestroyTree( &t) : 销毁 树 ,释放 树 t 占用 的 存储 空间 . 
TreeHeight(z) : 求 树 上 中 的 高 度 . 
Parent(t, p): 求 树 + 中 pp 所 指 结 点 的 双亲 结 点 . 
Borther(t, p): 求 树 上 中心 所 指 结 点 的 所 有 兄弟 结 点 . 
Sons(4,p): 求 树 上 中 忆 所 指 结 点 的 所 有 子孙 结 点 . 


712 树 的 逻辑 表示 方法 

树 的 逻辑 表示 方法 有 多 种 ,但 不 管 采 用 哪 种 表示 方法 ,都 应 该 能 够 正确 地 表达 出 树 中 结 
点 之 间 的 层次 关系 。 下 面 介绍 树 的 几 种 常见 逻辑 表示 方法 。 

(1) 树 形 表示 法 (tree representation) : 用 一 个 圆圈 表示 一 个 结 点 ,圆圈 内 的 符号 代表 
该 结 点 的 数据 信息 , 结 点 之 间 的 关系 通过 连 线 表示 。 虽 然 每 条 连 线 上 都 不 带 有 箭头 ( 即 方 
向 ) ,但 它 仍 然 是 有 方向 的 ,其 方向 隐 含 着 从 上 向 下 , 即 连 线 的 上 方 结 点 是 下 方 结 点 的 前 驱 结 
点 ,下 方 结 点 是 上 方 结 点 的 后 继 结 点 。 它 的 直观 形象 是 一 棵 倒置 的 树 ( 树 根 在 上 ,树叶 在 
下 ) ,如 图 7.1(a) 所 示 。 

说 明 : 在 树 形 表 示 法 中 ,尽管 用 没有 血 头 的 连 线 表示 结 点 之 间 的 关系 ,但 实际 上 树 中 结 点 
之 间 的 关系 是 一 种 有 向 关系 。 例 如 ,图 7.1(a) 中 结 点 A.BB 之 间 的 连 线 对 应 序 偶 <A,B>。 

(2) 文 氏 图 表示 法 (venn diagram representation) : 每 棵 树 对 应 一 个 圆圈 ,圆圈 内 包含 
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根 结 点 和 子 树 的 圆圈 ,同一 个 根 结 点 下 的 各 子 树 对 应 的 圆圈 是 不 能 相交 的 。 在 用 这 种 方法 
表示 的 树 中 , 结 点 之 间 的 关系 是 通过 圆圈 的 包含 来 表示 的 。 图 7.1(a) 所 示 的 树 对 应 的 文 氏 
图 表示 法 如 图 7.1(b) 所 示 。 





(a) 树 形 表示 法 (b) 文 氏 图 表示 法 


MI A(B(E,F).C(G(D).D(H,IK,LM))) 
(0) 凹 和 表示 法 (d) 括号 表示 法 
图 7.1 树 的 各 种 表示 法 


(3) 凹 人 表示 法 (concave representation) : 每 棵 树 的 根 结 点 对 应 一 个 条 形 , 其 子 树 的 根 
对 应 着 一 个 较 短 的 条 形 , 且 树 根 在 上 , 子 树 的 根 在 下 ,同一 个 根 下 的 各 子 树 的 根 对 应 的 条 形 
长 度 是 一 样 的 。 图 7. 1(a) 所 示 的 树 对 应 的 凹 人 表示 法 如 图 7. 1(c) 所 示 。 

(4) 括号 表示 法 (bracket representation) : 每 棵 树 对 应 一 个 形 如 “ 根 ( 子 树 1, 子 树 2,…， 
子 树 m)” 的 字符 串 ,每 棵 子 树 的 表示 方式 与 整 棵 树 类 似 ,各 子 树 之 间 用 逗号 分 开 。 在 用 这 种 
方法 表示 的 树 中 , 结 点 之 间 的 关系 是 通过 括号 的 租 套 表示 的 。 图 7.1(a) 所 示 的 树 对 应 的 括 
号 表示 法 如 图 7.1(d) 所 示 。 


713 树 的 基本 术语 


下 面 介绍 树 的 常用 术语 。 

(1) 结 点 的 度 与 树 的 度 : 树 中 某 个 结 点 的 子 树 的 个 数 称 为 该 结 点 的 度 
(degree of node) 。 树 中 所 有 结 点 的 度 中 的 最 大 值 称 为 树 的 度 (degree of tree) ， 
通常 将 度 为 m 的 树 称 为 m 次 树 (m-tree)。 例 如 ,图 7. 1(a) 是 一 棵 3 次 树 。 视频 讲解 


























数据 结构 教程 \ 目 DG 





(2) 分 支 结 点 与 叶子 结 点 : 树 中 度 不 为 零 的 结 点 称 为 非 终 端 结 点 ,又 叫 分 支 结 点 
(branch) 。 度 为 零 的 结 点 称 为 叶子 结 点 (leaf) 。 在 分 支 结 点 中 ,每 个 结 点 的 分 支 数 就 是 该 结 
点 的 度 。 如 对 于 度 为 1 的 结 点 ,其 分 支 数 为 1, 被 称 为 单 分 支 结 点 ; 对 于 度 为 2 的 结 点 ,其 分 
支 数 为 2, 被 称 为 双 分 支 结 点 , 依 此 类 推 。 例 如 ,在 图 7. 1(a) 所 示 的 树 中 ,BC 和 DD 等 是 分 支 
结 点 ,而 了 .FF 和 J 等 是 叶子 结 点 。 

(3) 路 径 与 路 径 长 度 : 对 于 树 中 的 任意 两 个 结 点 有 和 kj;, 若 树 中 存在 一 个 结 点 序列 
《kiska ska，… ,kan sk;) ,使 得 序列 中 除 k 以 外 的 任 一 结 点 都 是 其 在 序列 中 的 前 一 个 结 点 的 
后 继 结 点 , 则 称 该 结 点 序列 为 由 &; 到 k; 的 一 条 路 径 (path)。 路 径 长 度 (path length) 是 该 路 
径 所 通过 的 结 点 数目 减 1( 即 路 径 上 分 支 数目 )。 可 见 ,路 径 就 是 从 万 出 发 * 自 上 而 下 ”到 达 
ki 所 通过 的 树 中 结 点 序列 。 显 然 , 从 树 的 根 结 点 到 树 中 其 余 结 点 均 存 在 一 条 路 径 。 例 如 ， 
在 图 7. 1(a) 所 示 的 树 中 ,从 A 到 K 的 路 径 为 (A,D,I,K), 其 长 度 为 3, 而 (K,I,D,A) 为 A 
到 K 的 逆 路 径 。 

(4) 孩子 结 点 ,双亲 结 点 和 兄弟 结 点 : 在 一 棵 树 中 ,每 个 结 点 的 后 继 结 点 被 称 为 该 结 点 
的 孩子 结 点 (children) 。 相 应 地 ,该 结 点 被 称 为 孩子 结 点 的 双亲 结 点 (parents)。 具 有 同一 
双亲 结 点 的 孩子 结 点 互 为 兄弟 结 点 (sibling)。 进 一 步 推广 这 些 关 系 , 可 以 把 每 个 结 点 对 应 
子 树 中 的 所 有 结 点 ( 除 自身 外 ) 称 为 该 结 点 的 子孙 结 点 (descendant) ,把 从 根 结 点 到 达 某 个 
结 点 的 路 径 上 经 过 的 所 有 结 点 ( 除 自身 外 ) 称 为 该 结 点 的 祖先 结 点 (ancestor)。 例 如 ,在 
图 7.1(a) 所 示 的 树 中 , 结 点 B.C、D 互 为 兄弟 结 点 , 结 点 DD 的 子孙 结 点 有 HIK、L 和 M, 结 
点 工 的 祖先 结 点 有 A、D。 

(5) 结 点 层次 和 树 的 高 度 : 树 中 的 每 个 结 点 都 处 在 一 定 的 层次 上 。 结 点 层次 (level) 或 
结 点 深度 (depth) 是 从 树 根 开始 定义 的 , 根 结 点 为 第 一 层 , 它 的 孩子 结 点 为 第 二 层 , 依 此 类 
推 ,一 个 结 点 所 在 的 层次 为 其 双亲 结 点 的 层次 加 1。 树 中 结 点 的 最 大 层次 称 为 树 的 高 度 
(height of tree) 或 树 的 深度 (depth of tree) 。 

(6) 有 序 树 和 无 序 树 : 若 树 中 各 结 点 的 子 树 是 按照 一 定 的 次 序 从 左 向 右 安排 的 , 且 相 
对 次 序 是 不 能 随意 变换 的 , 则 称 为 有 序 树 (ordered tree) ,否则 称 为 无 序 树 (unordered tree) 。 
一 般 情况 下 ,如 果 没 有 特别 说 明 ,默认 树 都 是 指 有 序 树 。 

(7) 森林 : n(n 二 0) 个 互 不 相交 的 树 的 集合 称 为 森林 。 把 含有 多 棵 子 树 的 树 的 根 结 点 
删 去 就 成 了 森林 (forest) 。 反 之 ,给 m(m 记 1) 棵 独立 的 树 加 上 一 个 根 结 点 ,并 把 这 m 棵 树 作 
为 该 结 点 的 子 树 , 则 森林 就 变 成 了 一 棵 树 。 


714 树 的 性 质 


性 质 1: 树 中 的 结 点 数 等 于 所 有 结 点 的 度数 之 和 加 1 。 

证 明 : 根据 树 的 定义 ,在 一 棵 树 中 除根 结 点 以 外 ,每 个 结 点 有 且 仅 有 一 
个 前 驱 结 点 。 也 就 是 说 ,这 样 的 结 点 与 指向 它 的 一 个 分 支 一 一 对 应 。 所 以 视频 讲解 
除根 结 点 以 外 的 结 点 数 等 于 所 有 结 点 分 支 数 之 和 , 即 结 点 数 等 于 所 有 结 点 
分 支 数 之 和 加 1 ,而 所 有 结 点 分 支 数 之 和 恰好 等 于 所 有 结 点 的 度数 之 和 ,因此 树 中 的 结 点 数 
等 于 所 有 结 点 的 度数 之 和 加 1 。 

性 质 2: 度 为 m 的 树 中 第 i 层 上 最 多 有 mm! 个 结 点 (i 三 1)。 

证 明 : 采用 数学 归纳 法 证 明 。 
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对 于 第 一 层 , 非 空 树 中 的 第 一 层 上 只 有 一 个 根 结 点 ,由 i=1 代入 m1, 得 m1 二 m1 二 1， 
然 结论 成 立 。 

假设 对 于 第 (i 一 1) 层 (i 二 2) 命 题 成 立 , 即 度 为 m 的 树 中 第 (i 一 1) 层 上 最 多 有 m 个 结 
点 ,根据 树 的 度 的 定义 , 度 为 m 的 树 中 每 个 结 点 最 多 有 wm 个 孩子 结 点 ,所 以 第 i 层 上 的 结 点 
数 最 多 为 第 (i 一 1) 层 上 结 点 数 的 m 信 , 即 最 多 为 mm 三 m 站 个 结 点 , 故 命题 成 立 。 

推广 : 当 一 棵 mm 次 树 的 第 i 层 上 有 m 丰 :个 结 点 (i 三 1) 时 , 称 该 层 是 满 的 ,车 一 棵 x 次 树 
的 所 有 叶子 结 点 在 同一 层 ,并 且 除 该 层 以 外 的 每 一 层 都 是 满 的 , 称 为 满 m 次 树 (full 
m-tree)。 显 然 , 满 m 次 树 是 所 有 相同 高 度 的 m 次 树 中 结 点 总 数 最 多 的 树 。 也 可 以 说 ,对 于 
n 个 结 点 ,构造 的 m 次 树 为 满 m 次 树 或 者 接近 满 r 次 树 ,此 时 树 的 高 度 最 小 。 


性 质 3: 高 度 为 h 的 m 次 树 最 多 有 各 二 个 结 点 。 


明 : 由 树 的 性 质 2 可 知 ,第 i 层 上 最 多 的 结 点 数 为 m™' (i 二 1 一 h) ,显然 当 高 度 为 的 
m rp 次 树 时 结 点 个 数 最 多 ,因此 有 以 下 关系 。 


最 多 结 点 数 = 每 一 层 最 多 结 点 数 之 和 一 加 十 中 十 M 十 十 mil 一 好 


ee 


所 以 , 满 mn 次 树 的 另 一 种 定义 为 当 一 棵 高 度 为 h 的 m 次 树 上 的 结 点 数 等 于 呈 





hl 














二 时 称 


m—1 
该 树 为 满 m 次 树 。 例 如 ,对 于 一 棵 高 度 为 5 的 满 2 次 树 , 结 点 数 为 全 二 ==31; 对 于 一 棵 高 


度 为 5 的 满 3 次 树 ， 结 点 数 为 3 二 1=121. 


性 质 4: 具有 个 结 点 的 m a 久 度 为 log, (nCm 一 1) 十 1) 2 了。 
证 明 : 设 具 有 个 结 点 的 m 次 树 的 高 度 为 ,车 在 该 树 中 前 h 一 1 层 都 是 满 的 , 即 每 一 
层 的 结 点 数 都 等 于 m 站 个 (1<i<h 一 1), 第 h 层 ( 即 最 后 一 层 ) 的 结 点 数 可 能 满 ,也 可 能 不 


满 ,但 至 少 有 一 个 结 点 , 则 该 树 具有 最 小 的 高 度 。 
根据 树 的 性 质 3 可 得 : 加 一! 十 1<n<< 吕 一 


前 者 结 点 个 数 对 应 的 树 是 1 一 A 一 1 时 都 是 满 的 ,第 h 层 只 有 一 个 结 点 ; 后 者 结 点 个 数 
应 的 树 是 1~h 时 都 是 满 的 。 











为 了 便于 计算 ,将 其 等 价 地 改 为 。 。 加!<n< 轨 一 

均 乘 (m 一 1) 后 加 1: m1<n(m—1)+1<m’* 

取 以 mm 为 底 的 对 数 : h—1<log, (nm—1)+1)<h 

即 有 : logn (nmO—1)+1)<h<log,(n(m—1) 十 1) 二 1 
因 h 只 能 取 整 数 ,所 以 有 : h= logn (n(m—1)+1) 

结论 得 证 。 


例如 ,对 于 2 次 树 , 求 最 小 高 度 的 计算 公式 为 log: (n 十 1) ,车 n= 二 20, 则 最 小 高 度 为 5; 
对 于 3 次 树 , 求 最 小 高 度 的 计算 公式 为 logs (2n 十 1) , 若 "一 20, 则 最 小 高 度 为 4。 

【 例 7.1】 含有 nn 个 结 点 的 4 次 树 的 最 小 高 度 是 多 少 ? 最 大 高 度 是 多 少 ? 

根据 树 的 性 质 4, 含 有 个 结 点 的 4 次 树 的 最 小 高 度 minh= logs (3n 十 1) 。 


Q@ 工 表示 大 于 等 于 z 的 最 小 整数 ,例如 2.4 一 3; z 表示 小 于 等 于 z 的 最 大 整数 ,例如 2. 8 一 2。 
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对 于 4 次 树 , 其 中 至 少 有 一 个 结 点 的 度 为 4, 这样 的 树 具 有 最 大 高 度 : 除了 某 一 层 含 有 
4 个 结 点 以 外 ,其 余 各 层 都 只 有 一 个 结 点 ,显然 高 度 为 n 一 4 十 1 二 n 一 3。 所 以 ,含有 nn 个 结 点 
的 4 次 树 的 最 大 高 度 maxh 是 n 一 3。 

【 例 7.2】 若 一 棵 3 次 树 中 度 为 3 的 结 点 有 两 个 , 度 为 2 的 结 点 有 一 个 , 度 为 1 的 结 点 
有 两 个 , 则 该 3 次 树 中 总 的 结 点 个 数 和 叶子 结 点 个 数 分 别 是 多 少 ? 

设 该 3 次 树 中 总 的 结 点 个 数 为 n、 度 为 i 的 结 点 个 数 为 n; (0 三 i 三 3)。 依 题 意 有 
=2,ns=1,ns=2。 

每 个 度 为 i 的 结 点 在 所 有 结 点 度数 之 和 中 贡献 i 个 度 ,所 以 所 有 结 点 度数 之 和 三 1X 
m2Xn+3Xn=1X2+2X1+3X2=10。 

由 树 的 性 质 1 可 知 ,n 三 所 有 结 点 度数 之 和 十 1 二 10 十 1 二 11。 

对 于 3 次 树 ,显然 有 n= 二 no 十 nn 十 ns 十 ns。 

则 =n 一 一 ns 一 ns 二 11 一 2 一 1 一 3=6。 

所 以 该 3 次 树 中 总 的 结 点 个 数 和 叶子 结 点 个 数 分 别 是 11 和 6。 

说 明 : 在 m 次 树 中 计算 结 点 个 数 时 常用 的 关系 式 有 : 四 所 有 结 点 度 树 之 和 一 1 一 1; 
@@ 所 有 结 点 度数 之 和 一 羡 十 272 十 … 十 mn; @n 二 no 十 而 十 … 十 nm 。 
715 树 的 基本 运算 

由 于 树 属于 非 线 性 结构 , 结 点 之 间 的 关系 比 线性 结构 复杂 一 些 , 所 以 树 的 运算 比 以 前 讨 
论 过 的 各 种 线性 数据 结构 的 运算 要 复杂 很 多 。 树 的 运算 主要 分 为 以 下 3 大 类 : 

(1) 寻找 满足 某 种 特定 条 件 的 结 点 ,如 寻找 当前 结 点 的 双亲 结 点 等 ; 扫 一 扫 

(2) 插入 或 删除 某 个 结 点 ,如 在 树 的 指定 结 点 上 插入 一 个 孩子 结 点 或 
删除 指定 结 点 的 第 :个 孩子 结 点 等 

(3) 遍历 树 中 的 所 有 结 点 。 ee 

树 的 遍历 (traversal) 运 算是 指 按 某 种 方式 访问 树 中 的 所 有 结 点 且 每 一 视频 讲 角 
个 结 点 只 被 访问 一 次 。 树 的 遍历 方式 主要 有 先 根 遍 历 、 后 根 遍历 和 层次 遍历 3 种 。 注 意 , 树 
的 先 根 遍 历 和 后 根 遍历 过 程 都 是 递归 的 。 


先 根 遍 历 (preorder traversal) 的 过 程 如 下 : 

(1) 访问 根 结 点 ， 

(2) 按照 从 左 到 右 的 顺序 先 根 遍 历 根 结 点 的 每 一 棵 子 树 。 

例如 ,对 于 图 7. 1(Ca) 所 示 的 树 , 采 用 先 根 遍历 得 到 的 结 点 序列 为 ABEFCGJDHIKLM。 从 
中 可 以 看 出 , 先 根 遍历 序列 的 第 一 个 元 素 即 为 根 结 点 对 应 的 结 点 值 。 


后 根 遍 历 (postorder traversal) 的 过 程 如 下 : 

(1) 按照 从 左 到 右 的 顺序 后 根 遍 历 根 结 点 的 每 一 棵 子 树 ; 

(2) 访问 根 结 点 。 

例如 ,对 于 图 7. 1(a) 所 示 的 树 , 采 用 后 根 遍历 得 到 的 结 点 序列 为 EFBJGCHKLMIDA。 从 
中 可 以 看 出 ,后 根 遍历 序列 的 最 后 一 个 元 素 即 为 根 结 点 对 应 的 结 点 值 。 



























+ 
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ER 一 

层次 遍历 (level traversal) 的 过 程 是 从 根 结 点 开始 按 从 上 到 下 ,从 左 到 右 的 次 序 访问 村 
中 的 每 一 个 结 点 。 

例如 ,对 于 图 7. 1(a) 所 示 的 树 , 采 用 层次 遍历 得 到 的 结 点 序列 为 ABCDEFGHUKLM。 从 
中 可 以 看 出 ,层次 遍历 序列 的 第 一 个 元 素 即 为 根 结 点 对 应 的 结 点 值 。 


716 树 的 存储 结构 


存储 树 的 基本 要 求 是 既 要 存储 结 点 的 数据 元 素 本 身 , 又 要 存储 结 点 之 间 的 逻辑 关系 。 
有 关 树 的 存储 结构 很 多 ,下 面 介绍 3 种 常用 的 存储 结构 , 即 双 亲 存 储 结构 、 孩 子 链 存储 结构 
和 孩子 兄弟 链 存储 结构 。 


一 Ee 
双亲 存储 结构 (parent storage structure) 是 一 种 顺序 存储 结构 ,用 一 组 : 咎 

连续 空间 存储 树 的 所 有 结 点 ,同时 在 每 个 结 点 中 附设 一 个 伪 指针 指示 其 双 

亲 结 点 的 位 置 ( 因 为 除了 根 结 点 以 外 ,每 个 结 点 只 有 唯一 的 双亲 结 点 ,将 根 i 

结 点 的 双亲 结 点 位 置 设置 为 特殊 值 一 1) 。 视频 讲解 
双亲 存储 结构 的 类 型 声明 如 下 : 

















typedef struct 


{ ElemType data; // 存 放 结 点 的 值 
int parent; // 存 放 双 亲 的 位 置 
} PTree[MaxSize] ; //PTree 为 双亲 存储 结构 类 型 


例如 ,图 7.2(a) 所 示 的 树 对 应 的 双亲 存储 结构 如 图 7.2(b) 所 示 , 其 中 根 结 点 A 的 伪 指 
针 为 一 1, 其 孩子 结 点 B.C 和 D 的 双亲 伪 指 针 均 为 0,E、F 和 G 的 双亲 伪 指 针 均 为 2。 




















data parent 
0 -1 
(A) 1 0 
2 0 
(8) 人 CC) ; es 
加 四 加 :Er 
(a) 一 棵 树 (b) 对 应 的 双亲 存储 结构 


7.2 一 棵 树 的 双亲 存储 结构 





该 存储 结构 利用 了 每 个 结 点 ( 根 结 点 除外 ) 只 有 唯一 双亲 的 性 质 。 在 这 种 存储 结构 中 ， 
求 某 个 结 点 的 双亲 结 点 十 分 容易 ,但 在 求 某 个 结 点 的 孩子 结 点 时 需要 遍历 整个 存储 结构 。 


在 孩子 链 存储 结构 (child chain storage structure) 中 ,每 个 结 点 不 仅 包含 结 点 值 ,还 包 
括 指向 所 有 和 孩子 结 点 的 指针 。 由 于 树 中 每 个 结 点 的 子 树 个 数 ( 即 结 点 的 度 ) 不 同 , 如 果 按 各 
个 结 点 的 度 设计 变 长 结构 , 则 会 因为 结 点 的 孩子 结 点 的 指针 域 个 数 不 同 而 导致 算法 实现 非 
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常 麻烦 。 孩 子 链 存储 结构 可 按 树 的 度 ( 即 树 中 所 有 结 点 度 的 最 大 值 ) 设 计 结 点 的 孩子 结 点 的 
指针 域 个 数 。 
孩子 链 存储 结构 的 结 点 类 型 声明 如 下 : 


typedef struct node 


{ ElemType data; // 结 点 的 值 
struct node * sons[MaxSons]; // 指 向 孩子 结 点 
} TSonNode; // 孩 子 链 存 储 结构 中 的 结 点 类 型 


其 中 ,MaxSons 为 最 多 的 孩子 结 点 个 数 ,或 称 为 该 树 的 度 。 
例如 ,图 7.3(a) 所 示 的 一 棵 树 , 其 度 为 3, 所 以 在 设计 其 孩子 链 存储 结构 时 每 个 结 点 的 
指针 域 个 数 应 为 3, 对 应 的 孩子 链 存储 结构 如 图 7. 3(b) 所 示 。 


sons[1] 






























































data sons[0] sons[2 
内 A 人 
有 [人 [A 人 | 信 
后 辣 证 @[^I^I^ 人 ee 
四 GI 人 I 人 | 人 ^ 
(a) 一 棵 树 yp data hp (b) 树 的 孩子 链 存 储 结构 
Ng 
| 人 
和 
B| 二 ~|^ 人 @| 和 ^ 


























^ 人 部 局 二 大 学 -IAA 到 [和 
入 呵 和 ^ 
(c) 树 的 孩子 兄弟 链 存 储 结构 
图 7.3 一 棵 树 的 孩子 链 存储 结构 和 孩子 兄弟 链 存储 结构 























孩子 链 存储 结构 的 优点 是 查找 某 结 点 的 孩子 结 点 十 分 方便 ,其 缺点 是 查找 某 结 点 的 双 
亲 结 点 比较 费时 ,另外 , 当 树 的 度 较 大 时 存在 较 多 的 空 指针 域 。 

【 例 7.3】 以 孩子 链 作 为 树 的 存储 结构 ,设计 一 个 求 树 : 高 度 的 递归 算法 。 

设 /2) 为 树 上 的 高 度 , 其 递归 模型 如 下 。 


J 车 t=NULL 
f(D) = MAX {f(p)}+1 其 他 情况 


指向 的 孩 于 
对 应 的 递归 算法 如 下 : 
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int TreeHeightl(TSonNode * t) 


{ 


TSonNode * p; 
int i,h, maxh 一 0; 
if (t==NULL) return 0; 
else 
{ for(i=0;i<MaxSons;i 二 十 ) 
{ p=t—> sons 口 ; 
if (pl=NULL) 


// 空 树 返 回 高 度 0 
// 处 理 非 空 树 


//p 指 向 t 的 第 i 十 1 个 孩子 结 点 
// 若 存在 第 i 十 1 个 孩子 


{  h=TreeHeightl(p); // 求 出 对 应 子 树 的 高 度 
if (maxh < hb) maxh=h; // 求 所 有 子 树 的 最 大 高 度 
} 
} 
return(maxh 十 1); // 返 回 maxh 十 1 


} 


孩子 兄弟 链 存储 结构 (child brother chain storage structure) 是 为 每 个 结 点 设计 3 个 
域 , 即 一 个 数据 元 素 域 .一 个 指向 该 结 点 的 左边 第 一 个 孩子 结 点 (长 子 ) 的 指针 域 、. 一 个 指向 
该 结 点 的 下 一 个 兄弟 结 点 的 指针 域 。 

兄弟 链 存储 结构 中 结 点 的 类 型 声明 如 下 : 


typedef struct tnode 


{ ElemType data; // 结 点 的 值 
struct tnode * hp; // 指 向 兄弟 
struct tnode * vp; // 指 向 孩子 结 点 
} TSBNode; // 孩 子 兄 弟 链 存储 结构 中 的 结 点 类 型 


图 7.3(a) 所 示 的 树 的 孩子 兄弟 链 存储 结构 如 图 7. 3(c) 所 示 。 

由 于 树 的 孩子 兄弟 链 存 储 结构 固定 有 两 个 指针 域 ,并 且 这 两 个 指针 是 有 序 的 ( 即 兄弟 域 
和 孩子 域 不 能 混淆 ) ,所 以 孩子 兄弟 链 存储 结构 实际 上 是 把 该 树 转换 为 二 又 树 的 存储 结构 。 

在 后 面 将 会 讨论 ,把 树 转换 为 二 又 树 所 对 应 的 结构 恰好 就 是 这 种 孩子 兄弟 链 存储 结构 ， 
所 以 孩子 兄弟 链 存储 结构 的 最 大 优点 是 可 方便 地 实现 树 和 二 叉 树 的 相互 转换 。 孩 子 兄弟 链 
存储 结构 的 缺点 和 孩子 链 存储 结构 的 缺点 一 样 ,就 是 从 当前 结 点 查找 双亲 结 点 比较 麻烦 , 需 
要 从 树 的 根 结 点 开始 逐个 结 点 比较 查找 。 

【 例 7.4】 以 孩子 兄弟 链 作为 树 的 存储 结构 设计 一 个 求 树 1 高度 的 递归 算法 。 

其 递归 模型 与 例 7. 3 的 完全 相同 ,针对 孩子 兄弟 链 存储 结构 ,对 应 的 递归 算法 





如 下 。 aa 


int TreeHeight2(TSBNode * t) 
{ TSBNode * p; 
int h, maxh 一 0; 
if (t==NULL) return 0; 
else 
{ p=t=>us 


// 空 树 返 回 0 


//p 指向 第 1 个 孩子 结 点 
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while (p!=NULL) // 扫 描 t 的 所 有 子 树 
{  h=TreeHeight2(p); // 求 出 p 子 树 的 高 度 
让 (maxh<h) maxh 一 h; ”// 求 所 有 子 树 的 最 大 高 度 
p=p—>hp; // 继 续 处 理 + 的 其 他 子 树 
} 
return(maxh 十 1); // 返 回 maxh 十 1 


} 


例 7.4 和 例 7.3 的 功能 相同 ,但 树 的 存储 结构 不 同 ,所 以 在 算法 设计 上 存在 差异 。 
说 明 : 当 树 采用 孩子 兄弟 链 存 储 结构 时 , 树 的 算法 和 广义 表 的 算法 设计 方法 十 分 相似 。 


二 又 树 的 概念 和 性 质 用 





721 二叉树 的 定义 


二 叉 树 (binary tree) 是 一 个 有 限 的 结 点 集合 ,这 个 集合 或 者 为 空 ,或 者 
由 一 个 根 结 点 和 两 棵 互 不 相交 的 称 为 左 子 树 (left subtree) 和 右 子 树 (right 
subtree) 的 二 叉 树 组 成 。 

二 叉 树 的 抽象 数据 类 型 描述 和 树 的 抽象 数据 类 型 相似 ,这 里 不 再 介绍 。 显 然 ,和 树 的 定 
义 一 样 ,二 叉 树 的 定义 也 是 一 个 递归 定义 。 二 叉 树 的 结构 简单 ,存储 效率 高 ,其 运算 算法 也 
相对 简单 ,而 且 任 何 mm 次 树 都 可 以 转化 为 二 叉 树 结构 ,因此 二 叉 树 具有 很 重要 的 地 位 。 

二 叉 树 和 度 为 2 的 树 (2 次 树 ) 是 不 同 的 ,对 于 非 空 树 , 其 差别 表现 在 以 下 两 点 : 

。 度 为 2 的 树 中 至 少 有 一 个 结 点 的 度 为 2, 而 二 叉 树 没有 这 种 要 求 ; 

。 度 为 2 的 树 不 区 分 左 、 右 子 树 , 而 二 叉 树 是 严格 区 分 左 、 右 子 树 的 ， 

二 叉 树 有 5 种 基本 形态 ,如 图 7.4 所 示 , 任 何 复杂 的 二 又 树 都 可 以 看 成 是 这 5 种 基本 形 
态 的 复合 。 其 中 图 7. 4(a) 是 空 二 叉 树 ,图 7.4(b) 是 单个 结 点 的 二 叉 树 ,图 7. 4(c) 是 右 子 树 
为 空 的 二 叉 树 ,图 7. 4(d) 是 左 子 树 为 空 的 二 叉 树 , 图 7. 4(e) 是 左右 子 树 都 不 空 的 二 叉 树 。 


人 ,A\ 
(b) (9) (d) (©) 


(a) 
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图 7.4 二 叉 树 的 5 种 基本 形态 


二 叉 树 的 表示 法 也 和 树 的 表示 法 一 样 ,有 树 形 表示 法 、 文 氏 图 表示 法 、 目 入 表示 法 和 括 
号 表示 法 等 。 另 外 ,上 一 节 介 绍 的 树 的 所 有 术语 对 于 二 又 树 都 适用 。 

在 一 棵 二 又 树 中 ,如 果 所 有 分 支 结 点 都 有 左 孩子 结 点 和 右 孩 子 结 点 ,并 且 叶 子 结 点 都 集 
中 在 二 叉 树 的 最 下 一 层 , 这 样 的 二 又 树 称 为 满 二 叉 树 (full binary tree)。 图 7. 5(a) 所 示 就 
是 一 棵 满 二 叉 树 。 用 户 可 以 对 满 二 叉 树 的 结 点 进行 层 序 编号 (level coding) ,约定 编号 从 树 
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根 为 1 开始 ,按照 层 数 从 小 到 大 、 同 一 层 从 左 到 右 的 次 序 进行 ,图 7.5(a) 中 每 个 结 点 外 边 的 
数字 为 对 该 结 点 的 编号 。 当 然 也 可 以 从 结 点 个 数 和 树 高 度 之 间 的 关系 来 定义 , 即 一 棵 高 度 
为 h 且 有 2 一 1 个 结 点 的 二 又 树 称 为 满 二 又 树 。 





(a) 满 二 叉 树 (b) 完全 二 叉 树 
图 7.5 满 二 叉 树 和 完全 二 叉 树 


非 空 满 二 叉 树 的 特点 如 下 : 

。 叶子 结 点 都 在 最 下 一 层 ; 

。 只 有 度 为 0 和 度 为 2 的 结 点 。 

若 二 又 树 中 最 多 只 有 最 下 面 两 层 的 结 点 的 度数 可 以 小 于 2, 并 且 最 下 面 一 层 的 叶子 
结 点 都 依次 排列 在 该 层 最 左边 的 位 置 上 , 则 这 样 的 二 叉 树 称 为 完全 二 叉 树 (complete 
binary tree) ,图 7. 5(b) 所 示 为 一 棵 完全 二 叉 树 。 同 样 可 以 对 完全 二 叉 树 中 的 每 个 结 点 进 
行 层 序 编号 ,编号 的 方法 和 满 二 又 树 相 同 ,图 7.5(b) 中 每 个 结 点 外 边 的 数字 为 对 该 结 点 
的 编号 。 

不 难看 出 , 满 二 叉 树 是 完全 二 又 树 的 一 种 特例 ,并 且 完 全 二 又 树 与 同 高 度 的 满 二 又 树 的 
对 应 位 置 结 点 有 同一 编号 。 图 7. 5Cb) 所 示 的 完全 二 又 树 与 等 高 度 的 满 二 叉 树 相 比 在 最 后 
一 层 的 右边 缺少 了 4 个 结 点 。 

非 空 完全 二 又 树 的 特点 如 下 : 

。 叶子 结 点 只 可 能 在 最 下 面 两 层 中 出 现 ; 
对 于 最 大 层次 中 的 叶子 结 点 ,都 依次 排列 在 该 层 最 左边 的 位 置 上 ; 
如 果 有 度 为 1 的 结 点 ,只 可 能 有 一 个 , 且 该 结 点 只 有 左 孩 子 而 无 右 孩 子 ; 
。 按 层 序 编号 时 ,一 旦 出 现 编号 为 i 的 结 点 是 叶子 结 点 或 只 有 左 孩 子 , 则 编号 大 于 i 的 

结 点 均 为 叶子 结 点 

。 当 结 点 总 数 nn 为 奇数 时 ,nm 二 0, 当 结 点 总 数 nn 为 偶数 时 ,n= 二 1。 
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性 质 1: 非 空 二 叉 树 上 的 叶子 结 点 数 等 于 双 分 支 结 点 数 加 1 。 

证 明 : 设 二 又 树 上 的 叶子 结 点 数 为 no 、 单 分 支 结 点 数 为 m 、 双 分 支 结 点 
数 为 n,( 如 果 没 有 特别 指出 ,后 面 均 采 用 这 种 设 定 ), 则 总 结 点 数 4 二 nm 十 
十 ns。 在 一 棵 二 叉 树 中 ,所 有 结 点 的 分 支 数 ( 即 所 有 结 点 的 度 之 和 ) 应 等 于 
单 分 支 结 点 数 加 上 双 分 支 结 点 数 的 两 倍 , 即 总 的 分 支 数 一 半 十 2za 。 
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由 于 二 又 树 中 除了 根 结 点 以 外 ,每 个 结 点 都 有 唯一 的 一 个 分 支 指向 它 , 因 此 在 二 叉 树 中 
总 的 分 支 数 一 z 一 1。 

由 上 述 3 个 等 式 可 得 坟 十 2ns 二 no 十 而 十 nz 一 1, 即 wo 二 nz 十 1。 

说 明 : 在 二 又 树 中 计算 结 点 时 常用 的 关系 式 有 : 四 所 有 结 点 的 度 之 和 一 ?一 1; 四 所 有 
结 点 的 度 之 和 二 nn 十 2n2; @n 二 no 十 ni 十 nz 。 

性 质 2: 非 空 二 又 树 的 第 i 层 上 最 多 有 2! 个 结 点 (i 三 1)。 

由 树 的 性 质 2 可 推出 。 


性 质 3: 高 度 为 h 的 二 又 树 最 多 有 2 一 1 个 结 点 (h 宇 1)。 

由 树 的 性 质 3 可 推出 。 

性 质 4: 完全 二 叉 树 中 层 序 编号 为 i 的 结 点 (1 二 i<n,n 三 1,n 为 结 点 数 ) 有 以 下 性 质 : 
(1) 若 运 n/2 , 即 2i<n, 则 编号 为 i 的 结 点 为 分 支 结 点 ,否则 为 叶子 结 点 。 





(2) 车 nn 为 奇数 , 则 每 个 分 支 结 点 都 既 有 左 孩 子 结 点 ,又 有 右 孩 子 结 点 (例如 图 7. 5(b) 
所 示 的 完全 二 叉 树 就 是 这 种 情况 ,其 中 =11, 分 支 结 点 1 一 5 都 有 左 、 右 孩子 结 点 ); 车 nn 为 
偶数 , 则 编号 最 大 的 分 支 结 点 (编号 为 n/2 ) 只 有 左 孩 子 结 点 ,没有 右 孩 子 结 点 ,其 余 分 支 结 
点 都 有 左右 孩子 结 点 。 

(3) 车 编号 为 i 的 结 点 有 左 孩 子 结 点 , 则 左 孩子 结 点 的 编号 为 2i; 车 编号 为 i 的 结 点 有 
右 孩 子 结 点 , 则 右 孩 子 结 点 的 编号 为 2i 十 1。 

(4) 除根 结 点 以 外 , 若 一 个 结 点 的 编号 为 i, 则 它 的 双亲 结 点 的 编号 为 i/2 。 

上 述 性 质 均 可 采用 归纳 法 证 明 , 请 读者 自己 完成 。 

性 质 5: 具有 个 (mn 二 0) 结 点 的 完全 二 叉 树 的 高 度 为 log; (n 十 1) 或 logsn 十 1。 

由 完全 二 叉 树 的 定义 和 树 的 性 质 3 可 推出 。 

说 明 : 对 于 一 棵 完全 二 又 树 , 结 点 总 数 1 可 以 确定 其 形态 ,nl 只 能 是 0 或 1。 当 宛 为 偶 
数 时 ,1 二 1; 当 n 为 奇数 时 ,nm 二 0。 

【 例 7.5】 已 知 一 棵 完全 二 又 树 的 第 6 层 ( 设 根 为 第 1 层 ) 有 8 个 叶子 结 点 , 则 该 完全 
二 叉 树 的 结 点 个 数 最 多 是 多 少 ? 

完全 二 又 树 的 叶子 结 点 只 能 在 最 下 两 层 , 对 于 本 题 , 结 点 最 多 的 情况 是 第 6 层 为 倒 
数 第 二 层 , 即 1 一 6 层 构成 一 个 满 二 又 树 ,其 结 点 总 数 为 2 一 1 二 63。 第 6 层 有 2 二 32 个 结 
点 ,其 中 含 8 个 叶子 结 点 ,另外 有 32 一 8 三 24 个 非 叶 子 结 点 ,它们 中 的 每 个 结 点 都 有 两 个 孩 
子 结 点 ( 均 为 第 7 层 的 叶子 结 点 ), 计 48 个 叶子 结 点 ,这 样 最 多 的 结 点 个 数 二 63 十 48 二 111。 
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树 、 森 林 与 二 又 树 之 间 有 一 个 自然 的 对 应 关系 ,它们 之 间 可 以 互相 转换 , 即 任何 一 个 森 
林 或 一 棵 树 都 可 以 唯一 地 对 应 一 棵 二 又 树 ,而 任 一 棵 二 又 树 也 能 唯一 地 对 应 到 一 个 森林 或 
一 棵 树 上 。 正 是 由 于 有 这 样 的 一 一 对 应 关系 ,可 以 把 在 树 中 处 理 的 问题 对 应 到 二 叉 树 中 进 
行 处 理 ,从 而 把 问题 简单 化 ,因此 二 叉 树 在 树 的 应 用 中 显得 特别 重要 。 下 面 _， 扫 - 志 
介绍 森林 、 树 与 二 又 树 相互 转换 的 方法 。 国 员 时 














1T“ 和 森林 、 笃 转换 为 二 文 树 











这 种 转换 分 为 两 种 情况 ,一 是 单 棵 树 转 换 成 二 又 树 ,二 是 由 多 棵 树 构 成 
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的 森林 转换 成 二 叉 树 ,但 是 不 论 哪 种 情况 都 只 转换 成 一 棵 二 叉 树 。 
将 一 棵 树 转 换 成 二 叉 树 的 过 程 如 下 : 
(1) 树 中 所 有 相 邻 兄弟 之 间 加 一 条 连 线 ; 
(2) 对 树 中 的 每 个 结 点 只 保留 它 与 长 子 之 间 的 连 线 ,删除 与 其 他 孩子 之 间 的 连 线 ; 
(3) 以 树 的 根 结 点 为 轴 心 ,将 整 棵 树 顺 时 针 转 动 45° ,使 之 结构 层次 分 明 。 
【 例 7.6】 将 图 7.6(a) 所 示 的 树 转换 成 二 又 树 。 
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(©) 删除 与 双亲 节点 的 连 线 (d) 转换 后 的 二 叉 树 
7.6 一 棵 树 转换 成 一 棵 二 叉 树 的 过 程 


@ 


转换 过 程 如 图 7. 6(b) 一 (d) 所 示 ,最终 结果 如 图 7. 6(d) 所 示 。 

从 中 可 以 看 到 ,一 棵 树 T 转换 成 二 叉 树 BT 后 ,BT 中 的 左 分 支 仍 表示 T 中 的 孩子 关 
系 , 但 BT 中 的 右 分 支 却 表示 工 中 的 兄弟 关系 。 由 于 了 的 根 结 点 没有 兄弟 ,所 以 BT 的 根 结 
点 一 定 没 有 右 孩 子 结 点 。 

车 要 转换 为 二 又 树 的 森林 由 两 棵 或 两 棵 以 上 的 树 构成 ,将 这 样 的 森林 转换 为 二 又 树 的 
过 程 如 下 : 

(1) 将 森林 中 的 每 棵 树 转换 成 相应 的 二 又 树 。 

(2) 第 一 棵 二 又 树 不 动 ,从 第 二 棵 二 又 树 开始 ,依次 把 后 一 棵 二 叉 树 的 根 结 点 作为 前 一 
棵 二 又 树 根 结 点 的 右 孩 子 结 点 , 当 所 有 二 又 树 连 在 一 起 后 ,此 时 得 到 的 二 又 树 就 是 由 森林 转 
换 得 到 的 二 又 树 。 





实际 上 , 当 森 林 下 由 两 棵 或 两 棵 以 上 的 树 {T,T;,…,T,} 构 成 时 ,所 有 这 些 树 的 根 结 ~ 


点 构成 兄弟 关系 ,所 以 森林 下 转换 成 一 棵 二 叉 树 BT 后 ,将 第 一 棵 树 Ti 的 根 结 点 作为 BT 
的 根 结 点 ,Ts 的 根 结 点 作为 4 的 右 孩 子 结 点 ts ,Ts 的 根 结 点 作为 ts 的 右 孩 子 结 点 ts ,…， 
依次 类 推 。 

【 例 7.7】 将 图 7.7(a) 所 示 的 森林 转换 成 二 叉 树 。 

转换 过 程 如 图 7.7(b) 一 (e) 所 示 ,最 终结 果 如 图 7.7(e) 所 示 。 

【 例 7.8】 设 森 林 下 中 有 3 棵 树 , 第 1、 第 2、 第 3 棵 树 的 结 点 个 数 分 别 为 9 .8、7, 将 其 转 
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(a) 森林 (b) 相 邻 的 兄弟 加 连 线 (虚线 ) 
© © 
eg 
- Gf 六 
® ©-©-© | 四 
Y 
(©) 删除 与 双亲 结 点 的 连 线 (d) 每 棵 树 转换 成 的 二 叉 树 





(e) 所 有 二 叉 树 连接 成 一 棵 二 叉 树 
图 7.7 森林 转换 成 一 棵 二 叉 树 的 过 程 


换 成 二 叉 树 ,该 二 叉 树 根 结 点 的 右 子 树 上 的 结 点 个 数 是 多 少 ? 
与 森林 下 对 应 的 二 叉 树 根 结 点 的 右 子 树 上 的 结 点 是 由 第 2 和 第 3 棵 树 的 全 部 结 点 
转换 而 来 的 ,所 以 二 又 树 根 结 点 的 右 子 树 上 的 结 点 个 数 二 8 十 7 二 15。 


由 于 转换 过 程 分 为 两 种 情况 ,所 以 还 原 过 程 也 相应 地 分 为 两 种 情况 ,一 是 由 单 棵 树 转 换 
成 的 二 叉 树 还 原 成 树 ,二 是 由 多 棵 树 构成 的 森林 转换 成 的 二 叉 树 还 原 成 树 。 

车 一 棵 二 又 树 是 由 一 棵 树 转换 而 来 的 , 则 该 二 叉 树 还 原 为 树 的 过 程 如 下 : 

(1) 若菜 结 点 是 其 双亲 的 左 孩 子 , 则 把 该 结 点 的 右 孩 子 、 右 孩子 的 右 孩 子 等 都 与 该 结 点 
的 双亲 结 点 用 连 线 连 起 来 。 

(2) 删除 原 二 叉 树 中 所 有 双亲 结 点 与 右 孩 子 结 点 之 间 的 连 线 。 

(3) 整理 由 前 面 两 步 得 到 的 树 , 即 以 根 结 点 为 轴 心 , 逆 时 针 转 动 45 ,使 之 结构 层次 分 明 。 

实际 上 ,二 叉 树 的 还 原 就 是 将 二 叉 树 中 的 左 分 支 保持 不 变 , 将 二 叉 树 中 的 右 分 支 还 原 成 
兄弟 关系 。 

【 例 7.9】 将 图 7. 8(a) 所 示 的 一 棵 二 又 树 还 原 为 一 棵 树 。 

还 原 过 程 如 图 7.8(b) 一 (d) 所 示 ,最 终结 果 如 图 7. 8(d) 所 示 。 

若 一 棵 二 又 树 是 由 m 棵 树 构成 的 森林 转换 而 来 的 ,该 二 又 树 的 根 结 点 一 定 有 疡 一 1 个 








(a) 一 棵 二 叉 树 (b) 加 连 线 


A 
人 OH 
es © YD © 
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(c) 删除 与 右 孩子 的 连 线 (d) 还 原 后 的 树 


图 7.8 一 棵 二 叉 树 还 原 为 一 棵 树 的 过 程 


右 下 孩子 ,该 二 又 树 还 原 为 森林 的 过 程 如 下 : 


(1) 抹 掉 二 叉 树 根 结 点 右 链 上 的 所 有 结 点 之 间 的 “双亲 一 右 孩 子 ”关系 ,将 其 分 成 若干 
个 以 右 链 上 的 结 点 为 根 结 点 的 二 叉 树 , 设 这 些 二 叉 树 为 bt 、bts、…、bt。 。 


(2) 分 别 将 bt 、bts 、… 、bt,, 二 又 树 各 自 还 原 成 一 棵 树 。 
【 例 7.10】 将 如 图 7.9(a) 所 示 的 二 叉 树 还 原 为 森林 。 
国 还 原 为 森林 的 过 程 如 图 7.9(b) 和 (ce) 所 示 , 最 终结 果 如 图 7. 9(c) 所 示 。 


4 ?A 


(a) 一 棵 二 a (b) 分 为 3 棵 二 又 树 (©) 还 原 成 的 森林 
图 7.9 一 棵 二 叉 树 还 原 成 森林 的 过 程 








二 义 树 的 存储 结构 


与 线性 表 一 样 ,二叉树 也 有 顺序 存储 结构 和 链 式 存储 结构 。 
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731 二叉树 的 顺序 存储 结构 


二 叉 树 的 顺序 存储 结构 就 是 用 一 组 地 址 连续 的 存储 单元 来 存放 二 又 树 的 数据 元 素 , 因 
此 必须 确定 好 树 中 各 数据 元 素 的 存放 次 序 ,使 得 各 数据 元 素 在 这 个 存放 次 序 中 的 相互 位 置 
能 反映 出 数据 元 素 之 间 的 逻辑 关系 。 

由 二 叉 树 的 性 质 4 可 知 ,对 于 完全 二 叉 树 和 满 二 叉 树 , 树 中 结 点 的 层 序 编号 可 以 唯一 地 
反映 出 结 点 之 间 的 逻辑 关系 ,所 以 可 以 用 一 维 数组 按 从 上 到 下 、 从 左 到 右 的 顺序 存储 树 中 的 
所 有 结 点 值 , 通 过 数组 元 素 的 下 标 关 系 反映 完全 二 又 树 或 满 二 又 树 中 结 点 之 间 的 逮 辑 关系 。 

例如 ,图 7.5(b) 所 示 的 完全 二 叉 树 对 应 的 顺序 存储 结构 如 图 7. 10 所 示 , 编 号 为 i 的 结 
点 值 存放 在 数组 下 标 为 i 的 元 素 中 ('# ' 表 示 空 结 点 )。 由 于 C/C++ 语言 中 的 数组 下 标 从 0 
开始 ,这 里 为 了 一 致 性 而 没有 使 用 下 标 为 0 的 数组 元 素 。 

位 置 1 23 4 567 8 9 10 1 12 13 14 … MaxSizel 
结 点 值 [A| Blclplslrlclnalllglelelell we | 
图 7. 10 一 棵 完全 二 叉 树 的 顺序 存储 结构 


然而 对 于 一 般 的 二 叉 树 ,如 果 仍 按照 从 上 到 下 和 从 左 到 右 的 顺序 将 树 中 的 结 点 顺序 存储 
在 一 维 数组 中 , 则 数组 元 素 下 标 之 间 的 关系 不 能 够 反映 二 叉 树 中 结 点 之 间 的 逻辑 关系 ,这 时 可 
将 一 般 二 又 树 进行 改造 ,增添 一 些 并 不 存在 的 空 结 点 ,使 之 成 为 一 棵 完全 二 叉 树 的 形式 。 

图 7.11(a) 所 示 的 是 一 棵 一 般 的 二 叉 树 ,添加 一 些 虚 结 点 使 其 成 为 一 棵 完全 二 叉 树 的 结果 
如 图 7.11(b) 所 示 , 再 对 所 有 结 点 按 层 序 编号 ,然后 仅 保留 实际 存在 的 结 点 ,如 图 7. 11(c) 所 
示 。 接 着 把 各 结 点 值 按 编号 存储 到 一 维 数组 中 ,在 二 叉 树 中 人 为 增添 的 结 点 ( 空 结 点 ) 在 数 
组 中 所 对 应 的 元 素 值 为 一 特殊 值 , 例 如 '# ' 字 符 , 如 图 7. 12 所 示 。 


扫 一 扫 

















(b) 添加 虚 结 点 使 其 成 为 一 棵 完全 二 又 树 
7.11 一 般 二 叉 树 按 完全 二 叉 树 结 点 编号 
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四 ORDER 








(c) 仅 保留 实际 存在 的 结 点 
图 7.11 ( 续 ) 


9 10 11 12 13 14 … MaxSize-l 
ee [aTeTeToTeT*T rT TolnT+r T+T' TT 和 


图 7.12 一 棵 二 叉 树 的 顺序 存储 结构 


也 就 是 说 ,一 般 二 叉 树 采用 顺序 存储 结构 后 ,二 叉 树 中 各 结 点 的 编号 与 等 高 度 的 完全 二 
叉 树 中 位 置 上 结 点 的 编号 相同 ,这 样 对 于 一 个 编号 (下 标 ) 为 i 的 结 点 ,如 果 有 双亲 ,其 双亲 
结 点 的 编号 (下 标 ) 为 i/2 ; 如 果 它 有 左 孩 子 , 其 左 孩子 结 点 的 编号 (下 标 ) 为 2i; 如 果 它 有 
右 孩 子 , 其 右 孩 子 结 点 的 编号 (下 标 ) 为 2i 十 1。 

二 又 树 顺 序 存 储 结 构 的 类 型 声明 如 下 : 


typedef ElemType SqBinTree[MaxSize] ; 


其 中 ,ElemType 为 二 叉 树 中 结 点 的 数据 值 类 型 ,MaxSize 为 顺序 表 的 最 大 长 度 。 为 了 方便 
运算 ,通常 将 下 标 为 0 的 位 置 空 着 , 空 结 点 用 '# ' 值 表示 。 

显然 ,完全 二 又 树 或 满 二 又 树 采 用 顺序 存储 结构 比较 合适 , 既 能 够 最 大 可 能 地 节省 存储 
空间 ,又 可 以 利用 数组 元 素 的 下 标 确定 结 点 在 二 叉 树 中 的 位 置 以 及 结 点 之 间 的 关系 。 对 于 
一 般 二 叉 树 ,如 果 它 接近 于 完全 二 叉 树 形态 .需要 增加 的 空 结 点 个 数 不 多 ,也 可 以 采用 顺序 
存储 结构 。 Ce 
序 存储 结构 会 造成 空间 的 大 量 浪费 。 最 坏 情况 是 右 单 支 树 ( 除 叶子 结 点 外 每 个 结 点 只 
个 右 孩 子 ) ,一 棵 高 度 为 六 的 右 单 支 树 , 只 有 户 个 结 点 , 却 需要 分 配 2 一 1 个 存储 单元 。 

在 顺序 存储 结构 中 ,查找 一 个 结 点 的 孩子 、 双 亲 结 点 都 很 方便 ,编号 (下 标 ) 为 i 的 结 点 
的 层次 为 log; (i 十 1) 。 

由 于 二 又 树 顺序 存储 结构 具有 顺序 存储 结构 的 固有 缺陷 ,使 得 二 叉 树 的 插入 、 删 除 等 运 
算 十 分 不 方便 。 因 此 ,对 于 一 般 二 又 树 通 常 采 用 下 面 介绍 的 链 式 存储 方式 。 


732 二 又 树 的 链 式 存储 结构 


二 叉 树 的 链 式 存储 结构 是 指 用 一 个 链表 来 存储 一 棵 二 又 树 ,二叉树 中 的 每 一 个 结 点 用 
链表 中 的 一 个 结 点 来 存储 。 二 叉 树 链 式 存储 结构 中 结 点 的 标准 存储 结构 如 下 : 


lchild data rchild 
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其 中 ,data 表示 值 域 ,用 于 存储 对 应 的 数据 元 素 ,lchild 和 rchild 分 别 表示 左 指针 域 和 
右 指 针 域 ,分 别 用 于 存储 左 孩 子 结 点 和 右 孩 子 结 点 的 存储 地 址 。 这 种 链 式 存储 结构 通常 简 
称 为 二 叉 链 (binary linked list) 。 二 又 链 中 通过 根 结 点 指针 2 来 唯一 标识 整个 存储 结构 , 称 
为 二 叉 树 5。 

二 又 链 中 结 点 类 型 BTNode 的 声明 如 下 : 


typedef struct node 


{ ElemType data; // 数 据 元 素 
struct node * lchild; // 指 向 左 孩子 结 点 
struct node * rchild; // 指 向 右 孩 子 结 点 
} BTNode; 


由 于 本 章 后 面 的 算法 均 用 到 二 又 链 存 储 结构 ,为 此 将 其 类 型 定义 存储 到 头 文件 btree. h 
中 。 例 如 ,图 7.13(a) 所 示 的 二 叉 树 对 应 的 二 叉 链 存储 结构 如 图 7. 13(b) 所 示 。 


















































(A) b A 
(8) 和 引入 
@Q 加 日 1 
(9) 
和 |c|^ 
(a) 一 棵 二 叉 树 (b) 二 叉 链 存储 结构 


图 7.13 一 棵 二 又 树 及 其 二 叉 链 存储 结构 
二 叉 链 存储 结构 的 优点 是 对 于 一 般 的 二 叉 树 比较 节省 存储 空间 ,在 二 叉 链 中 访问 一 个 
结 点 的 孩子 很 方便 ,但 访问 一 个 结 点 的 双亲 结 点 需要 扫描 所 有 结 点 。 有 时 为 了 高 效 地 访问 
一 个 结 点 的 双亲 结 点 ,可 在 每 个 结 点 中 再 增加 一 个 指向 双亲 的 指针 域 parent, 这 样 就 构成 了 
二 叉 树 的 3 叉 链 表 , 其 结 点 结构 如 图 7. 14 所 示 。 


lchild parent data rchild 





图 7.14 二 叉 树 的 3 叉 链表 结 点 结构 


说 明 : 为 了 简便 ,在 后 面 讨论 的 二 又 树 中 均 假设 每 个 结 点 值 为 单个 字符 , 即 ElemType 
为 char 类 型 。 在 没有 特别 指出 的 情况 下 ,假设 一 棵 二 又 树 中 的 所 有 结 点 值 均 不 相同 。 


二 叉 树 的 基本 运算 及 其 实现 





741 二 叉 树 的 基本 运算 概述 
归纳 起 来 .二叉树 有 以 下 基本 运算 .为 了 方便 ,假设 二 又 树 均 采用 二 又 链 存储 结构 进行 存储 。 
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创建 二 叉 树 CreateBTree(b,str) : 根据 二 叉 树 括号 表示 法 字符 串 str 生成 对 应 的 二 
又 链 存储 结构 ,0 为 创建 的 二 叉 链 的 根 结 点 指针 。 
。 销毁 二 又 树 DestroyBTree( &b) : 释放 二 叉 树 5 中 所 有 结 点 分 配 的 空间 。 
。 查找 结 点 FindNode(5,z): 在 二 又 树 5 中 寻找 data 域 值 为 z 的 结 点 ,并 返回 指向 该 
结 点 的 指针 。 
找 孩子 结 点 LchildNode(p) 和 RehildNode(p): 分 别 求 二 叉 树 中 p 所 指 结 点 的 左 孩 
子 结 点 和 右 孩 子 结 点 。 
。 求 高 度 BTHeight(5): 求 二 又 树 5 的 高 度 。 
输出 二 叉 树 DispBTree(5) : 以 括号 表示 法 输出 一 棵 二 又 树 5。 
742 二叉树 的 基本 运算 算法 实现 
本 小 节 采 用 二 叉 链 存储 结构 讨论 二 又 树 的 基本 运算 算法 。 
假设 采用 括号 表示 法 表示 的 二 叉 树 字符 串 str 是 正确 的 ,用 ch 扫描 str, 其 中 只 有 4 类 
字符 ,其 处 理 方式 如 下 。 
。 若 ch='(': 表示 前 面 刚 创建 的 结 点 p 存在 孩子 结 点 ,需要 将 其 进 栈 作 为 栈 顶 结 点 ， 
以 便 建立 它 和 它 的 孩子 结 点 之 间 的 关系 (如 果 一 个 结 点 刚 创 建 完毕 ,其 后 一 个 字符 
不 是 '(', 表 示 该 结 点 是 叶子 结 点 ,不 需要 进 栈 )。 然 后 开始 处 理 该 结 点 的 左 孩 子 , 置 人 
三 1( 表 示 其 后 创建 的 结 点 将 作为 这 个 栈 顶 结 点 的 左 孩 子 结 点 )。 
车 ch 王 )': 表示 以 栈 顶 结 点 为 根 结 点 的 子 树 创建 完毕 ,将 其 退 栈 。 
车 ch 王 '，': 表示 开始 处 理 栈 顶 结 点 的 右 孩 子 结 点 , 置 上 一 2( 表 示 其 后 创建 的 结 点 将 
作为 当前 栈 顶 结 点 的 右 孩 子 结 点 ) 。 
其 他 情况 : 只 能 是 单个 字符 ,对 应 二 叉 树 中 的 某 个 结 点 值 , 需 要 创建 
-个 结 点 p 存放 该 结 点 值 。 根 据 值 建立 它 与 栈 顶 结 点 之 间 的 联 
系 。 当 k==1 时 ,将 结 点 p 作为 栈 顶 结 点 的 左 孩 子 ; 当 k=2 时 ,将 结 
点 p 作为 栈 顶 结 点 的 右 孩 子 。 和 
如 此 循环 直到 str 处 理 完毕 。 算 法 中 使 用 一 个 栈 St 保存 双亲 结 点 ,top 视频 讲解 
为 栈 顶 指针 ,k 指定 其 后 处 理 的 结 点 是 双亲 结 点 ( 栈 顶 结 点 ) 的 左 孩 子 (&= 
1) 还 是 右 孩 子 (k 二 2)。 














































对 应 的 算法 如 下 : 
# include "btree. h" // 包 含 二 叉 树 的 存储 结构 声明 
void CreateBTree(BTNode * &b,char * str) Sse, 
{ BTNode * St[MaxSize], * p; //St 数组 作为 顺序 栈 

int top 一 一 1,k,j 王 0; //top 为 栈 顶 指 针 

char ch; 

b=NULL:; // 初 始 时 二 叉 链 为 空 

ch=str0]; 

while (ch!="\0') // 循 环 扫描 str 中 的 每 个 字符 

{ switch(ch) 

{ 
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case '(':top 十 十 ;St[top] =p;k=1; break; 
case 0) ':top 一 一 ;break; 
case ', ':k=2; break; 
default:p= (BTNode * )malloc(sizeof( BTNode)); 
p 一 data=ch; 
Sl 
if (b==NULL) 
b=p; 
else 
{ switch(k) 
{ 
case 1:St[top]—> lchild= p;break; 
case 2:St[top]—> rchild= p; break; 


// 开 始 处 理 左 孩 子 结 点 

// 栈 顶 结 点 的 子 树 处 理 完毕 
// 开 始 处 理 右 孩子 结 点 

// 创 建 一 个 结 点 ,由 p 指向 它 
// 存 放 结 点 值 

// 左 ` 右 指针 都 设置 为 空 

// 若 尚未 建立 根 结 点 

//p 所 指 结 点 就 作为 根 结 点 
// 已 建立 二 叉 树 根 结 点 


// 新 建 结 点 作为 栈 顶 结 点 的 左 孩子 
// 新 建 结 点 作为 栈 顶 结 点 的 右 孩子 


// 继 续 扫描 str 


例如 ,对 于 括号 表示 的 字符 串 “A(B(D(,G)),CCE,F))”, 建 立 二 又 树 链 式 存 储 结构 的 
过 程 如 表 7. 1 所 示 ( 栈 中 的 元 素 A 表示 A 结 点 的 地 址 ) ,最 后 生成 的 二 叉 链 如 图 7. 13(b) 





所 示 。 
表 7.1 建立 二 叉 树 链 式 存储 结构 的 过 程 
ch 算法 执行 的 操作 St 中 的 元 素 ( 栈 底 定 栈 顶 ) 
A 建立 A 结 点 ,6 指向 该 结 点 空 
( A 结 点 进 栈 , 置 人 一 1 A 
B 建立 BB 结 点 , 因 k=1, 将 其 作为 A 结 点 的 左 孩 子 A 
( 也 结 点 进 栈 , 置 人 一 1 AB 
D 建立 DD 结 点 , 因 k 二 1, 将 其 作为 B 结 点 的 左 孩 子 AB 
( D 结 点 进 栈 , 置 人 =1 ABD 
置 人 一 2 ABD 
G 建立 G 结 点 , 因 & 一 2, 将 其 作为 D 结 点 的 右 孩子 ABD 
) 退 栈 一 次 AB 
) 退 栈 一 次 A 
， 置 k 二 2 A 
Cc 建立 C 结 点 , 因 k 一 2, 将 其 作为 A 结 点 的 右 孩 子 A 
¢ C 结 点 进 栈 , 置 k 二 1 AC 
E 建立 下 结 点 , 因 k 一 1, 将 其 作为 C 结 点 的 左 孩子 AC 
; 置 k=2 AC 
下 建立 F 结 点 , 因 & 一 2, 将 其 作为 C 结 点 的 右 孩子 AC 
) 退 栈 一 次 A 
) 退 栈 一 次 空 
ch 扫描 完毕 算法 结束 
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设 /(5) 的 功能 是 释放 为 二 又 树 5 中 的 所 有 结 点 分 配 的 空间 。 其 递归 模型 如 下 : 


f(b) 不 做 任何 事情 车 6 二 NULL 
f(b) f(b 一 >lchild); f(b 一 > rchild); 释放 4 所 指 结 点 ; 其 他 情况 


对 应 的 递归 算法 如 下 : 


void DestroyBTree(BTNode * &b) 
{ if(b!=NULL) 
{ DestroyBTree(b—> lchild) ; 
DestroyBTree(b —> rchild) ; 
free(b) ; 


3 TN 





设 /(5,z) 的 功能 是 在 二 叉 树 5b 中 查找 值 为 x 的 结 点 ,找到 后 返回 其 地 址 ,否则 返回 
NULL。 其 递归 模型 如 下 : 


fob,7x) = NULL 车 6b==NULL 

fay Bb 若 5 一 > data 一 一 工 

(bx) = 若 在 左 子 树 中 找到 了 , 即 2 一 7 -> lchild,z) 且 p!=NULL 
flb,x) = f(b —> rchild,z) 其 他 情况 

对 应 的 递归 算法 如 下 : 


BTNode * FindNode(BTNode * b,ElemType x) 
{ BINode * p; 
if (b== NULL) 
return NULL; 
else if (b 一 data 一 一 x) 
return b; 
else 
{ p=FindNode(b 一 Ichild, x); 
if (p!=NULL) 
return p; 
else 
return FindNode(b 一 > rchild, x); 








于 扫 孩 子叶 上 EehYTONgS (PD) REPTTONGSS Cp) 


直接 返回 结 点 p 的 左 孩 子 或 右 孩 子 地址 。 算 法 如 下 : 


BTNode * LchildNode(BTNode * p) // 返 回 结 点 p 的 左 孩子 指针 
{ 
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return p —> lchild; 
: 
BTNode * RehildNode(BTNode * p) // 返 回 结 点 p 的 右 孩子 指针 
{ 

return p —> rchild; 


} 


5 


求 二 叉 树 的 高 度 的 递归 模型 /CO) 如 下 : 


Wb 0 车 b=NULL 
f(b) = MAX{f(b —>1child), f(6—> rchild)}+1 其 他 情况 


对 应 的 递归 算法 如 下 : 


int BTHeight(BTNode * b) 
{ int lchildh,rchildh; 


if (b== NULL) return(0); // 空 树 的 高 度 为 0 

else 

{ lchildh=BTHeight(b —> lchild); // 求 左 子 树 的 高 度 为 lchildh 
rchildh= BTHeight(b—> rchild) ; // 求 右 子 树 的 高 度 为 rchildh 


return (lchildh > rchildh)? (lchildh 十 1) :(rchildh 十 1); 


} 


DA) 

其 过 程 是 对 于 非 空 二 又 树 5, 先 输出 结 点 5 的 结 点 值 , 当 它 存 在 左 孩子 或 右 孩 子 时 输出 
一 个 “(” 符 号 ,然后 递归 处 理 左 子 树 ; 当 存 在 右 孩 子 时 ,输出 一 个 “,” 符 号 ,再 递归 处 理 右 子 
树 , 最 后 输出 一 个 “)” 符 号 。 对 应 的 递归 算法 如 下 : 





void DispBTree(BTNode * b) 
{ if(b!=NULL) 
{ printf("%e",b—> data); 
if (b—>lchild!=NULL | b-> rchild!=NULL) 


{printf("("); // 有 孩子 结 点 时 才 输 出 "(" 
DispBTree(b 一 lchild) ; // 递 归 处 理 左 子 树 
让 (b 一 rchild!==NULL) printf(",");  // 有 右 孩子 结 点 时 才 输 出 ",” 
DispBTree(b 一 > rchild) ; // 递 归 处 理 右 子 树 
printf(")"); // 有 孩子 结 点 时 才 输 出 ")" 
EPE 


} 


例如 ,调用 前 面 的 函数 CreateBTree(b,"A(B(D(,G)),C(E,F))") 构 造 一 棵 二 又 树 5， 
再 调用 DispBTree(5) ,其 执行 结果 如 下 : 





AC(B(CD(,G)) ,CE, F)) 
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二 又 树 的 遍历 


751 二 叉 树 遍 历 的 概念 

二 叉 树 的 遍历 是 指 按照 一 定 的 次 序 访问 二 叉 树 中 的 所 有 结 点 ,并 且 每 个 结 点 仅 被 访问 
一 次 的 过 程 。 它 是 二 叉 树 最 基本 的 运算 ,是 二 又 树 中 所 有 其 他 运算 实现 的 基础 。 

一 棵 二 叉 树 由 3 个 部 分 ( 即 根 结 点 . 左 子 树 和 右 子 树 ) 构 成 ,可 以 从 任何 部 分 开始 遍历 ， 
所 以 有 3!( 即 6) 种 遍历 方法 。 若 规定 子 树 的 遍历 总 是 先 左 后 右 ( 先 右 后 左 与 之 对 称 ), 则 对 
于 非 空 二 叉 树 ,可 得 到 以 下 3 种 递归 的 遍历 方法 , 即 先 序 遍 历 、 中 序 遍 历 和 后 序 遍历 。 另 外 
还 有 一 种 常见 的 层次 遍历 方法 。 扫 -- 扫 

先 序 遍历 (preorder traversal) 二叉树 的 过 程 如 下 : 

(1) 访问 根 结 点 ， 

(2) 先 序 遍 历 左 子 树 ; 

(3) 先 序 遍 历 右 子 树 。 

例如 ,图 7.13(a) 所 示 的 二 又 树 的 先 序 序列 为 ABDGCEF。 显 然 ,在 一 棵 二 叉 树 的 先 序 
序列 中 ,第 一 个 元 素 即 为 根 结 点 对 应 的 结 点 值 。 


中 序 遍 历 (inorder traversal) 二 叉 树 的 过 程 如 下 : 

(1) 中 序 遍 历 左 子 树 ; 

(2) 访问 根 结 点 

(3) 中 序 遍 历 右 子 树 。 

例如 ,图 7.13(a) 所 示 的 二 叉 树 的 中 序 序列 为 DGBAECF。 显 然 ,在 一 棵 二 叉 树 的 中 序 
序列 中 , 根 结 点 值 将 其 序列 分 为 前 、 后 两 个 部 分 ,前 部 分 为 左 子 树 的 中 序 序列 ,后 部 分 为 右 子 
树 的 中 序 序列 。 

后 序 遍 历 (postorder traversal) 二 叉 树 的 过 程 如 下 : 

(1) 后 序 遍 历 左 子 树 ; 

(2) 后 序 遍 历 右 子 树 ; 

(3) 访问 根 结 点 。 

例如 ,图 7.13(a) 所 示 的 二 叉 树 的 后 序 序列 为 GDBEFCA。 显 然 , 在 一 棵 二 又 树 的 后 序 
序列 中 ,最 后 一 个 元 素 即 为 根 结 点 对 应 的 结 点 值 。 

EE 

层次 遍历 (level traversal) 不 同 于 前 面 3 种 遍历 方法 , 它 是 非 递 归 的 ,用 于 一 层 一 层 地 访 
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问 二 又 树 中 的 所 有 结 点 。 其 过 程 如 下 ; 
若 二 又 树 非 空 (假设 其 高 度 为 有) , 则 : 
(1) 访问 根 结 点 (第 1 层 ); 
(2) 从 左 到 右 访问 第 2 层 的 所 有 结 点 





(3) 从 左 到 右 访 问 第 3 层 的 所 有 结 点 、…… \ 第 用 层 的 所 有 结 点 。 
例如 ,图 7.13(a) 所 示 的 二 叉 树 的 层次 遍历 序列 为 ABCDEFG。 显 然 ,在 一 棵 二 叉 树 的 
层次 遍历 序列 中 ,第 一 个 元 素 即 为 根 结 点 对 应 的 结 点 值 。 扫 - 扫 









752 先 序 .中 序 和 后 序 遍 历 递归 算法 


由 二 叉 树 的 先 序 、 中 序 和 后 序 3 种 遍历 过 程 直接 得 到 以 下 3 种 递归 jo 
算法 : 视频 讲解 











void PreOrder(BTNode * b) // 先 序 遍历 递归 算法 
{ if(b!=NULL) 

{ printf("%e ",b—> data); // 访 问 根 结 点 
PreOrder(b -> lchild) ; // 先 序 遍 历 左 子 树 
PreOrder(b —> rchild) ; // 先 序 遍 历 右 子 树 

} 

} 
void InOrder(BTNode * b) // 中 序 人 遍历 递归 算法 
{ if(b!=NULL) 

{InOrder(b—> 1child); // 中 序 遍 历 左 子 树 
printf(" %e ",b 一 > data) ; // 访 问 根 结 点 
InOrder(b —> rchild) ; // 中 序 遍 历 右 子 树 

} 

} 
void PostOrder(BTNode * b) // 后 序 遍 历 递归 算法 
{ if(b!=NULL) 

{ PostOrder(b—> lchild) ; // 后 序 遍 历 左 子 树 
PostOrder(b -> rchild) ; // 后 序 遍 历 右 子 树 
printf("%c ",b 一 > data) ; // 访 问 根 结 点 


} 





上 述 算 法 中 访问 根 结 点 采用 的 是 直接 输出 根 结 点 值 , 在 实际 中 访问 根 结 点 可 以 对 其 进 
行 各 种 操作 ,如 结 点 计数 .删除 结 点 等 。 

递归 算法 在 执行 中 需要 多 次 调用 自身 。 例 如 ,对 于 图 7. 13(b) 所 示 的 二 又 链 , 先 序 遍 历 算 
法 PreOrder(A) 的 执行 过 程 如 图 7.15 所 示 。 为 了 简便 ,其 中 参数 A 表示 结 点 A 的 地 址 ,其余 
类 同 。 图 中 的 实 箭头 表示 调用 步 (对 应 递归 的 分 解 ) , 虚 箭 头 表 示 返 回 步 ( 对 应 递归 的 求 值 ) 。 

从 上 面 可 以 看 出 ,3 种 递归 算法 虽然 简单 ,但 执行 过 程 是 十 分 复杂 的 。 一 般 情况 下 , 递 
归 调 用 从 哪里 开始 ,执行 最 后 一 定 要 返回 到 这 个 调用 的 地 方 。 扫 - 扫 

【 例 7.11】 假设 二 又 树 采 用 二 又 链 存储 结构 存储 ,设计 一 个 算法 , 计 
算 一 棵 给 定 二 叉 树 的 所 有 结 点 个 数 。 

二 又 链 的 基本 结构 如 图 7. 16 所 示 。 设 /(5) 求 二 又 树 5b 中 的 所 有 | 站 觅 和 s 浊 
结 点 个 数 是 “大 问题 ”, 则 f(65 一 > lchild) 和 f(65 一 > rchild) 分 别 求 左 、 右 子 树 视频 讲解 





























PreOrder(A) 一 一 ~ 访问 A | 
Ed i 2 
' PreOrder(B) — we 
\ r WD Ee 
' 1 PreOrder(D) 一 一 访问 D 
| | | AN preOrder(NULL) 
! \ 1 
1 六 Prod) —— WG "| 
' | Pomnut ! 
‘ | | \\ PreOrder(NULD)Y 
‘PreOrd 
Npreorder(B) WE 
有 和. | 
,PreOrder(NULL) ， 
全 We | 
PreOrder(NULL) | 


图 7.15 PreOrder(A) 的 执行 过 程 


中 的 所 有 结 点 个 数 , 是 两 个 "小 问题 ”它们 与 大 问题 的 求解 过 程 是 相似 的 。 递 归 模型 (4) 
如 下 : 


f(b) 一 0 车 b=NULL 
fb) = f(b => 1ehild)+ f(b 一 > rchild) 十 1 其 他 情况 
Ab): 大 问题 





Rb->Ichild) : 小 问题 ”fb->rehild) : 小 问题 
图 7.16 二 叉 链 的 基本 结构 

对 应 的 递归 算法 如 下 : 

int Nodes(BTNode * b) 

{ f(b==NULL) 


return 0; 
else 
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return Nodes(b 一 lchild) 十 Nodes(Cb —> rchild) 十 1; 
} 


其 中 最 后 语句 的 执行 过 程 是 先 扫 描 左 子 树 , 再 扫描 右 子 树 , 最 后 是 根 结 点 ( 计 1), 所 以 本 算 
法 采用 的 是 后 序 遍 历 思路 。 由 于 “十 1” 可 以 放 在 返回 表达 式 的 任何 位 置 , 对 应 不 同 的 遍历 思 
路 。 也 就 是 说 ,本 例 算法 可 以 基于 3 种 遍历 递归 算法 中 的 任何 一 种 。 

说 明 : 从 例 7. 11 可 以 看 出 ,直接 采用 递归 算法 设计 方法 和 基于 某 种 遍历 递归 方法 会 得 
到 相同 的 结果 ,实际 上 前 者 是 后 者 的 基础 ,所 以 掌握 基本 的 二 又 树 的 递归 算法 设计 方法 对 于 


二 又 树 问题 的 求解 是 十 分 重要 的 。 

【 例 7.12】 假设 二 又 树 采用 二 叉 链 存储 结构 存储 , 试 设计 一 个 算法 ,输出 一 棵 给 定 二 
叉 树 的 所 有 叶子 结 点 。 

输出 一 棵 二 叉 树 的 所 有 叶子 结 点 的 递归 模型 /(5) 如 下 。 

f(b) 不 做 任何 事件 车 b=NULL 

f(b) ”输出 5b 所 指 结 点 的 data 域 车 5 所 指 结 点 为 叶子 结 点 

fb) fb ->1child); f(b 一 rchild) 其 他 情况 

对 应 的 递归 算法 如 下 : 


void DispLeaf(BTNode * b) 
{ if(b!=NULL) 
{ if(b->lchild==NULL && b—>rchild==NULL) 


printf("%e ",b 一 > data); // 访 问 叶 子 结 点 
DispLeaf(b -> lchild) ; // 输 出 左 子 树 中 的 叶子 结 点 
DispLeaf(b -> rchild) ; // 输 出 右 子 树 中 的 叶子 结 点 


} 


上 述 算法 实际 上 是 采用 先 序 遍历 递归 算法 输出 所 有 叶子 结 点 的 ,所 以 叶子 结 点 是 以 从 
左 到 右 的 次 序 输出 的 , 若 要 改 成 以 从 右 到 左 的 次 序 输出 所 有 叶子 结 点 ,显然 只 需要 将 先 序 遍 
历 方式 的 左右 子 树 访问 次 序 倒 过 来 即 可 。 对 应 的 算法 如 下 : 

void DispLeafl (BTNode * b) 


{ if(b!=NULL) 
{ if(b->lchild==NULL && b—>rchild==NULL) 





printf("%c ",b—> data); // 访 问 叶子 结 点 
DispLeafl(b -> rchild) ; // 输 出 右 子 树 中 的 叶子 结 点 
DispLeafl(b -> lchild) ; // 输 出 左 子 树 中 的 叶子 结 点 
} 
} 
一 棵 二 叉 树 由 根 结 点 、 左 和 右 子 树 3 个 部 分 构成 ,又 可 以 分 为 根 结 点 和 子 树 两 类 ,在 设 


计 二 又 树 算法 时 根 结 点 是 可 以 直接 处 理 的 , 子 树 处 理 不 是 直接 的 ,需要 递归 处 理 。 
如 果 必 须 先 处 理 根 结 点 ,再 处 理子 树 ,就 是 基于 先 序 遍历 的 思路 。 例 如 , 例 7. 12 的 算法 
是 要 输出 叶子 结 点 ,所 以 先 判断 当 前 结 点 是 否 为 叶子 结 点 。 尽 管 也 可 以 在 左 、 右 子 树 处 理 之 
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后 再 来 判断 是 否 为 叶子 结 点 ,但 后 者 不 如 前 者 清晰 。 

如 果 必 须 先 处 理子 树 , 再 处 理 根 结 点 ,就 是 基于 后 序 遍历 的 思路 。 例 如 ,在 7.4.2 小 节 
中 ,销毁 二 叉 树 的 DestroyBTree(&b) 算 法 就 是 基于 后 序 遍 历 的 ,如 果 先 释放 根 结 点 ,那么 
就 找 不 到 它 的 左 、 右 子 树 了 。 

有 些 问 题 在 求解 时 既 可 以 先 处 理 根 结 点 ,又 可 以 先 处 理子 树 ,也 就 是 说 与 根 结 点 和 子 树 
的 处 理 次 序 无 关 , 这 样 可 以 采用 基于 先 序 遍历 或 者 后 序 遍 历 思路 来 求解 。 例 如 , 例 7. 12 的 
算法 便 是 如 此 。 

如 果子 树 的 处 理 需 要 区 分 左 、 右 子 树 ,就 需要 考虑 中 序 遍 历 的 思路 ,这 种 情况 比较 少 , 所 
以 二 叉 树 算法 大 部 分 都 是 基于 先 序 遍历 或 者 后 序 遍 历 思路 来 求解 的 。 

【 例 7.13】〗 假设 二 又 树 采用 二 又 链 存储 结构 ,设计 一 个 算法 求 二 又 树 5 中 结 点 值 为 x 
的 结 点 的 层次 (或 者 深度 ), 并 利用 二 叉 树 的 基本 运算 算法 编写 一 个 完整 的 程序 ,建立 
图 7.13(a) 所 示 的 二 叉 树 的 二 叉 链 ,对 于 用 户 输入 的 任何 结 点 值 计 算出 在 该 二 又 树 中 的 
层次 。 

设计 算法 为 Level(5,z,h) ,其 返回 值 为 在 二 叉 树 0 中 查找 结 点 值 为 zx 的 结 点 所 在 
的 层次 ,返回 0 表示 未 找到 。 如 果 0 为 空 树 ,返回 0; 如 果 当 前 根 结 点 的 结 点 值 为 x, 则 返回 
Ai 否则 在 左 子 树 中 查找 (层次 hh 需要 增 1), 若 在 左 子 树 中 未 找到 ,再 在 右 子 树 中 查找 (层次 
hh 需要 增 1) 。 

实现 本 例 功能 的 完整 程序 如 下 : 


# include "btree. cpp" 


int Level(BTNode * b,ElemType x, int h) //h 置 初 值 1 
wa 
i (b==NULL) 
return(0); 
else if (b—> data 一 一 x) 
return(h) ; 
else 
{ 1=Level(b—> lchild,x,h 十 1); // 在 左 子 树 中 查找 
if (1!=0) 
return(1); // 在 左 子 树 中 找到 了 ,返回 1 
else // 在 左 子 树 中 未 找到 ,再 在 右 子 树 中 查找 


return(Level(b 一 > rchild,x,h 十 1)); 
} 
} 





int main() 

{ BTNode x*b; es 
int h; 
ElemType x; 


CreateBTree(b, "A(B(D(,G)),C(E,F))"); 
printf("b:");DispBTree(b) ;printf("\n"); 
printf(" 结 点 值 :"); 

scanf("%e", Bx); 

h=Level(b, x,1); 

if (h==0) 
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printf("b 中 不 存在 %c 结 点 \n", x); 
else 

printf(" 在 b 中 %c 结 点 的 层次 为 %d\n",x,h); 
DestroyBTree(b); // 销 毁 二 叉 树 
return 1; 


} 
Level(b,z,h) 算 法 采用 的 是 基于 先 序 遍历 的 思路 。 以 上 程序 执行 一 次 的 结果 如 下 : 


b: A(B(D(,G)),C(E,F)) 
结 点 值 :Ew 
在 b 中 下 结 点 的 层次 为 3 


本 例 涉 及 递归 算法 形 参 赋 初 值 的 问题 。 在 Level 算法 中 ,6b 形 参 用 于 在 二 叉 链 中 遍历 结 
点 ,该 算法 中 又 需要 知道 它 的 层次 ,在 这 种 情况 下 就 需要 增加 一 个 形 参 久 , 它 表示 5b 所 指 的 
结 点 层次 。 在 调用 本 算法 时 总 是 从 根 结 点 开始 查找 的 ,而 根 结 点 的 层次 为 1, 所 以 h 的 初 值 
为 1, 即 调用 方式 是 Level(b,zx,1)。 

【 例 7.14】 假设 二 又 树 采用 二 又 链 存储 结构 ,设计 一 个 算法 求 二 又 树 5 中 第 k 层 的 结 
点 个 数 。 

设计 算法 为 Lnodenum(5.h,k,&n) ,h 表示 4b 所 指 的 结 点 层次 ,n 是 引用 型 参数 ,用 
于 求 第 & 层 的 结 点 个 数 。 在 初始 调用 时 ,2 为 根 结 点 指针 ,h 为 1,n 赋值 为 0, 即 调用 方式 是 
n=0; Lnodenum(b,1,k,n), 


采用 基于 先 序 遍 历 的 思路 得 到 以 下 算法 : 


void Lnodenum(BTNode * b,int h,int k,int &n) 


{ if(b==NULL) // 空 树 直接 返回 
return; 
else // 处 理 非 空 树 
{ if Ch==k) n 十 十 ; // 当 前 访问 的 结 点 在 第 k 层 时 n 增 1 
else if (h<k) // 车 当前 结 点 层次 小 于 k, 递 归 处 理 左右 于 树 


{ Lnodenum(b—> lchild,h 十 1,k,n); 
Lnodenum(b—> rchild,h 十 1,k,n); 
} 


} 


在 上 述 算法 中 ,引用 型 形 参 n 用 于 记录 二 又 树 5 中 第 k 层 的 结 点 个 数 ,也 可 以 用 全 局 变 
量 来 代替 ,功能 等 价 的 算法 如 下 : 


int n 一 0; // 全 局 变量 
void Lnodenuml(BTNode * b,int h,int k) 
Cbe=NUOLLY // 空 树 直接 返回 
return; 
else // 处 理 非 空 树 
ky ns // 当 前 访问 的 结 点 在 第 kk 层 时 n 增 1 


else if (h<k) // 若 当前 结 点 层次 小 于 k, 递归 处 理 左 、 右 子 树 
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{ ，Lnodenuml(b 一 lchild,h 十 1,k); 
Lnodenuml(b 一 > rchild,h 十 1,k); 


在 算法 执行 完毕 后 , 求 得 的 为 二 叉 树 中 第 A 层 的 结 点 个 数 。 从 中 可 以 看 出 ,函数 中 
的 引用 型 形 参 可 以 通过 全 局 变量 来 实现 。 一 般 情况 下 ,只 有 在 函数 的 形 参 个 数 比 较 多 并 且 
数据 类 型 复杂 时 为 了 简化 算法 才 采 用 这 种 方法 。 

【 例 7.15】 假设 二 叉 树 采用 二 叉 链 存储 结构 ,设计 一 个 算法 判断 两 棵 扫 -要 

















二 叉 树 是 否 相 似 。 所 谓 二 叉 树 51 和 22 相似 指 的 是 51 和 5b2 都 是 空 的 二 又 加 
树 ; 或 者 51 和 62 的 根 结 点 是 相似 的 ,以 及 51 的 左 子 树 和 22 的 左 子 树 是 相 et 
似 的 ,并 且 51 的 右 子 树 与 52 的 右 子 树 是 相似 的 。 1 : 
判断 两 棵 二 叉 树 51 和 02 是 否 相似 的 递归 模型 /(51,62) 如 下 。 视频 讲 角 
f(b1,62)=true 车 61=b2=NULL 
f(b1,62)=false 若 刀 .02 之 一 为 NULL, 另 一 个 不 为 NULL 


f(b1,62)= f(61 一 > lchild,b2 —> lchild) && 其 他 情况 
f(b1 一 > rchild,b2 一 > rchild) 


对 应 的 算法 如 下 : 


bool Like(BTNode * bl ,BTNode * b2) 
//bl 和 b2 两 棵 二 叉 树 相似 时 返回 true, 否则 返回 false 
{ bool likel ,like2; 
if (bl==NULL && b2==NULL) 
return true; 
else if (bl==NULL | b2==NULL) 
return false; 
else 
{ likel=Like(bl -> lchild, b2 一 > lchild) ; 
like2 王 Like(bl 一 > rchild, b2 一 > rchild) ; 
return (likel &.& like2); // 返 回 likel 和 like2 的 与 运算 结果 


} 





【 例 7.16】 假设 二 又 树 采 用 二 又 链 存储 结构 ,设计 一 个 算法 输出 值 为 z 的 结 点 的 所 有 


祖先 。 aa 


根据 二 又 树 中 祖先 的 定义 可 知 ,车 结 点 p 的 左 孩 子 或 右 孩 子 是 结 点 g, 则 结 点 p 
是 结 点 g 的 祖先 ; 车 结 点 p 的 左 孩 子 或 右 孩 子 是 gq 结 点 的 祖先 , 则 结 点 p 也 是 结 点 g 的 
祖先 。 

设 /(5,z) 表 示 结 点 65 是否 为 值 是 x 的 结 点 的 祖先 , 若 结 点 0 是 值 为 x 的 结 点 的 祖先 ， 
f(5,z) 返 回 true; 否则 f(5,z) 返 回 false。 当 f(5,z) 为 true 时 ,输出 结 点 5 的 值 。 求 值 为 
Zz 的 结 点 的 所 有 祖先 的 递归 模型 (56,z) 如 下 : 
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Jo,z) 一 false 车 b==NULL 

f(b, zz) 二 true, 并 输出 5b 一 > data 车 结 点 5 的 左 孩子 或 右 孩子 的 data 域 为 工 

f(b,z) 一 true, 并 输出 0 一 > data 车 f(5 -> lchild,x) 为 true 或 f(b -> rchild,z) 为 true 
f(b, x) = false 其 他 情况 

对 应 的 算法 如 下 : 


bool ancestor(BTNode * b,ElemType x) 
{ if(b==NULL) 
return false; 
else if (b—> 1child!=NULL && b—>1child—> data==x 
| b—>rchild!=NULL && b—> rchild 一 > data==x) 
{ printf("%e ",b—> data); 
return true; 
} 
else if (ancestor(b -> lchild, x) || ancestor(b -> rchild, x)) 
{ printf("%ce ",b—> data); 
return true; 
} 


else return false; 


753 先 序 、 中 序 和 后 序 遍 历 非 递归 算法 * 


二 又 树 是 一 种 递归 数据 结构 ,其 先 序 、 中 序 和 后 序 遍 历 算法 采用 递归 方式 设计 是 理 所 当 
然 的 ,但 大 家 掌握 对 应 的 非 递归 算法 可 以 进一步 加 深 对 这 3 种 遍历 算法 的 理解 ,提高 应 用 它 
们 的 能 力 。 


先 序 遍 历 非 递归 算法 主要 有 两 种 设计 方法 。 

1) 先 序 遍历 非 递归 算法 1 

由 先 序 沉 历 过 程 可 知 , 先 访问 根 结 点 ,再 遍历 左 子 树 ,最 后 遍历 右 于 树 。 由 于 在 二 叉 链 
中 左右 子 树 是 通过 根 结 点 的 指针 域 指向 的 ,在 访问 根 结 点 后 遍历 左 子 树 时 会 委 失 右 子 树 的 
地 址 ,需要 使 用 一 个 栈 来 临时 保存 左右 子 树 的 地 址 。 

由 于 栈 的 特点 是 先进 后 出 ,而 先 序 选 历 是 先 谢 历 左 子 树 ,再 遍历 右 子 树 ,所 以 当 访 问 完 
一 个 非 叶 子 结 点 后 应 先 将 其 右 孩子 进 本 ,再 将 其 左 孩子 进 栈 。 对 应 的 非 递归 过 程 如 下 





将 根 结 点 b 进 栈 ; 
while ( 栈 不 空 ) 
{ ”出 栈 结 点 p 并 访问 之 ; 
若 p 结 点 有 右 孩 子 , 将 其 右 孩 子 进 栈 ; 
若 p 结 点 有 左 孩 子 , 将 其 左 孩 子 进 栈 ; 
} 

















该 算法 中 的 栈 采用 顺序 栈 存 储 结构 ,其 类 型 声明 如 下 : 
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typedef struct 


{ 


BTNode * data[MaxSize] ; 
int top; 


} SqStack; 


// 存 放 栈 中 的 数据 元 素 
// 存 放 栈 顶 指针 
// 顺 序 栈 类 型 


相关 的 栈 运 算 算 法 设计 见 3. 1. 2 小 节 , 本 小 节 的 所 有 非 递归 算法 都 使 用 这 样 的 顺序 栈 。 
先 序 遍历 非 递归 算法 1 如 下 : 


void PreOrderl(BTNode * b) 


{ 


} 


BTNode * pi; 

SqStack * st; 

InitStack( st) ; 

if (b!=NULL) 

{ Push(st,b); 
while (!StackEmpty(st)) 
{ Pop(st,p); 


printf("%e ",p—> data); 

if (p—> rchild!= NULL) 
Push(st, p 一 rchild) ; 

if (p—>1child!=NULL) 
Push(st, p—> lchild) ; 


} 
printf("\n"); 
} 
DestroyStack( st); 


// 先 序 非 递 归 遍 历 算法 1 


// 定 义 栈 指针 st 
// 初 始 化 栈 st 


// 根 结 点 进 栈 

// 栈 不 为 空 时 循环 
// 退 栈 结 点 p 并 访问 它 
// 有 右 孩 子 时 将 其 进 栈 


// 有 左 孩子 时 将 其 进 栈 


// 销 毁 栈 


对 于 图 7.13(b) 所 示 的 二 叉 树 0, 上 述 算法 的 执行 过 程 如 表 7.2 所 示 , 最 后 的 输出 序列 
为 ABDGCEF。 表 中 “A” 表 示 A 结 点 的 地 址 ,下 同 。 
表 7.2， 先 序 遍历 非 递归 算法 1 的 执行 过 程 





操 作 栈 ( 栈 底 空 栈 项 ) 访问 的 结 点 
根 结 点 A 进 栈 A 
根 结 点 A 出 栈 , 访 问 A 空 A 
将 A 结 点 的 右 孩 子 C 进 栈 C 
将 A 结 点 的 左 孩子 B 进 栈 CB 
结 点 也 出 栈 ,访问 B C B 
结 点 了 B 的 左 孩子 进 栈 CD 
结 点 D 出 栈 ,访问 D C D 
结 点 DD 的 右 孩 子 进 栈 CG 
结 点 G 出 栈 , 访 问 G C G 
结 点 C 出 栈 ,访问 C 空 C 
结 点 C 的 右 孩 子 F 进 栈 F 
结 点 C 的 左 孩子 下 进 栈 FE 
结 点 下 出 栈 , 访 问 下 区 E 
结 点 下 出 栈 , 访 问 下 空 F 


栈 空 , 算 法 结束 
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2) 先 序 遍历 非 递 归 算法 2 

先 序 遍历 顺序 是 根 结 点 . 左 子 树 和 右 子 树 , 所 以 先 访问 根 结 点 & 及 其 所 有 左下 结 点 ,由 
于 在 二 义 链 中 无 法 由 孩子 找到 其 双亲 ,所 以 需要 将 这 些 访 问 过 的 结 点 进 栈 保存 起 来 。 此 时 
当前 栈 顶 结 点 要 么 没有 左 子 树 ( 实 际 上 是 没有 左 孩 子 ) ,要 么 左 子 树 已 遍历 过 ,所 以 转向 它 的 
右 子 树 ,对 右 子 树 的 处 理 与 上 述 过 程 类 似 。 对 应 的 非 递归 过 程 如 下 : 


p=b; 
while ( 栈 不 空 或 者 p! 二 NULL) 
{ ”while ( 结 点 p 有 左 孩 子 ) // 对 于 结 点 p 及 其 所 有 的 左下 结 点 , 边 访问 边 进 栈 
{ ”访问 结 点 p; 将 其 进 栈 ; 
p=p—> lchild 
} 
// 此 时 栈 顶 结 点 (已 访问 ) 没 有 左 孩 子 ,或 者 左 子 树 已 遍历 过 
让 ( 栈 不 空 ) 
{ ”出 栈 p; 
p=p—> rchild; 
} 
} 


首先 让 p 指向 根 结 点 ,然后 开始 外 循环 ,每 一 轮 循环 分 为 两 个 阶段 ,第 一 个 阶段 是 沿 着 
结 点 p 的 左下 方向 查找 , 边 访问 边 进 栈 ,直到 最 左下 结 点 ( 它 没有 左 孩 子 ); 第 二 个 阶段 出 栈 
一 个 结 点 p, 通 过 让 p 指向 它 的 右 孩 子 再 重复 循环 来 遍历 右 子 树 。 

每 一 轮 外 循环 结束 时 ,所 有 栈 中 的 结 点 均 已 访问 且 它 的 左 子 树 已 遍历 (或 者 左 子 树 为 
空 ) ,等 待 遍 历 右 子 树 ; 而 p 指向 刚刚 出 栈 结 点 的 右 子 树 。 显 然 , 当 栈 空 而 且 p= 二 NULL 时 
表示 所 有 结 点 都 访问 了 ,算法 结束 。 

例如 ,对 于 图 7. 13(b) 所 示 的 二 叉 树 ,其 先 序 遍 历 非 递归 算法 2 的 执行 过 程 如 表 7. 3 所 
示 , 也 可 以 用 图 7. 17 来 描述 ,其 中 箭头 表示 处 理 结 点 的 过 程 ,整个 过 程 是 从 A 结 点 开始 的 。 
结 点 旁 的 数字 表示 访问 该 结 点 的 次 序 ,“ 十 "表示 该 结 点 进 栈 ,“ 一 "表示 该 结 点 出 栈 , 下 同 。 

表 7.3 先 序 遍 历 非 递归 算法 2 的 执行 过 程 








执行 的 操作 访问 结 点 修改 后 的 p 值 。” st( 栈 底 中 栈 顶 ) 
A.B.D 结 点 依次 进 栈 并 访问 之 ,p==p 一 > lchild ABD p=NULL ABD 
出 栈 了 D 结 点 ,p 指向 它 ,p= 二 p 一 > rchild 指向 G 结 点 AB 
G 结 点 进 栈 并 访问 之 ,p= 二 p 一 > lchild G p=NULL ABG 
出 栈 G 结 点 ,p 指向 它 ,p==p 一 > rchild p=NULL AB 
出 栈 B 结 点 ,p 指向 它 ,p 二 p 一 > rchild p=NULL A 
出 栈 A 结 点 ,p 指向 它 ,p=p 一 > rchild 户 指向 C 结 点 
C\E 结 点 依次 进 栈 并 访问 之 ,p= 二 p 一 > lchild CE p=NULL CE 
出 栈 玉 结 点 ,p 指向 它 ,p= 二 p 一 > rchild p=NULL C 
出 栈 C 结 点 ,p 指向 它 ,p= 二 p 一 > rchild 妃 指向 下 结 点 
下 结 点 进 栈 并 访问 之 ,p= 二 p 一 > lchild F p=NULL F 
出 栈 下 结 点 ,p 指向 它 ,p= 二 p 一 > rchild p=NULL 


栈 空 且 p= 二 NULL, 退 出 循环 ,算法 结束 














图 7.17 先 序 遍历 非 递归 算法 2 的 执行 过 程 


对 应 的 先 序 遍 历 非 递归 算法 2 如 下 : 


void PreOrder2(BTNode * b) // 先 序 人 遍历 非 递 归 算法 2 
{ BTNode x pi 
SqStack * st; // 定 义 一 个 顺序 栈 指针 st 
InitStack(st); // 初 始 化 栈 st 
p=b; 
while (!StackEmpty(st) || p!=NULL) 
{ while (p!=NULL) // 访 问 结 点 p 及 其 所 有 左下 结 点 并 进 栈 
{ printf("%c ",p 一 > data); // 访 问 结 点 p 
Push(st, p); // 结 点 p 进 栈 
p=p —> lehild; // 移 动 到 左 孩 子 
} 
if (!StackEmpty( st)) // 若 栈 不 空 
{ Pop(st,p); // 出 栈 结 点 p 
p=p 一 rchild; // 转 向 处 理 其 右 子 树 


} 
1 
printf("\n"); 
DestroyStack( st) ; // 销 毁 栈 
} 


2 中 序 沉 历 非 洱 归 算 状 


中 序 遍历 非 递 归 算法 是 在 前 面 先 序 遍 历 非 递归 算法 2 的 基础 上 修改 的 ， 





中 序 遍 历 顺 序 是 左 子 树 , 根 结 点 、 右 子 树 。 所 以 需要 将 根 结 点 及 其 左下 结 点 依 
次 进 栈 ,但 还 不 能 访问 ,因为 它们 的 左 子 树 没有 遍历 。 当 达到 根 结 点 的 最 左下 
结 点 时 , 它 是 中 序 序列 的 开始 结 点 ,也 是 栈 项 结 点 ,出 栈 并 访问 它 , 然 后 转向 它 














的 右 子 树 ,对 右 子 树 的 处 理 与 上 述 过 程 类 似 。 对 应 的 非 递归 过 程 如 下 : 


p=b; 
while ( 栈 不 空 或 者 p! 二 NULL) 
{ ”while ( 结 点 p 有 左 孩 子 ) 
{ ”将 p 进 栈 ; 
p=p—> lchild; 
} 
// 此 时 栈 顶 结 点 (尚未 访问 ) 没 有 左 孩 子 或 左 子 树 已 遍历 过 
让 ( 栈 不 空 ) 
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{ ”出 栈 p 并 访问 之 ; 
p=p—> rchild; 
} 
} 


当 每 一 轮 外 循环 结束 时 ,所 有 栈 中 结 点 均 未 访问 但 它 的 左 子 树 已 遍历 (或 者 左 子 树 为 
空 ) ,等 待 访问 并 遍历 右 子 树 ; 而 p 指向 刚刚 访问 结 点 (出 栈 结 点 ) 的 右 子 树 。 当 栈 空 而 且 
p 二 NULL 时 ,表示 所 有 结 点 都 访问 了 ,算法 结束 。 

例如 ,对 于 图 7.13(b) 所 示 的 二 叉 树 ,其 中 序 遍 历 非 递归 算法 的 执行 过 程 如 表 7.4 所 
示 , 也 可 以 用 图 7. 18 来 描述 。 


表 7.4 中 序 遍 历 非 递归 算法 的 执行 过 程 





执行 的 操作 访问 结 点 修改 后 的 p 值 st( 栈 底 只 栈 顶 ) 

A、B.D 结 点 进 栈 ,p 二 p 一 > lchild p=NULL ABD 
出 栈 了 D 结 点 并 访问 它 ,p==p 一 > rchild D 指向 G 结 点 AB 
G 结 点 进 栈 ,p=p 一 > lchild p=NULL ABG 
出 栈 G 结 点 并 访问 它 ,p==p 一 > rchild G p=NULL AB 
出 栈 B 结 点 并 访问 它 ,p=p 一 > rchild B p=NULL A 
出 栈 A 结 点 并 访问 它 ,p==p 一 > rchild A 指向 C 结 点 

C\EE 结 点 进 栈 ,p= 二 p 一 > lchild p=NULL CE 
出 栈 玉 结 点 并 访问 它 ,p==p 一 > rchild E p=NULL 
出 栈 C 结 点 并 访问 它 ,p=p 一 > rchild C 妃 指 向 下 结 点 

下 结 点 进 栈 ,p 二 p 一 > lchild p=NULL F 
出 栈 下 结 点 并 访问 它 ,p==p 一 > rchild F p=NULL 


栈 空 且 p 二 NULL, 退 出 外 循环 ,算法 结束 





图 7.18 中 序 遍历 非 递归 算法 的 执行 过 程 


对 应 的 中 序 遍 历 非 递归 算法 如 下 : 
void InOrderl(BTNode * b) // 中 序 人 遍历 非 递归 算法 
{ BTNode * p; 
SqStack * st; // 定 义 一 个 顺序 栈 指针 st 


InitStack(st); // 初 始 化 栈 st 
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p=b; 
while (!StackEmpty(st) || p!=NULL) 
{while (p!=NULL) // 扫 描 结 点 p 的 所 有 左下 结 点 并 进 栈 
{ Push(st,p); // 结 点 p 进 栈 
p=p 一 lchild; // 移 动 到 左 孩子 
if (!StackEmpty(st)) // 若 栈 不 空 
{ Pop(st,p); // 出 栈 结 点 Pp 
printf("%c ",p—> data); // 访 问 结 点 p 
p=p 一 rchild; // 转 向 处 理 其 右 子 树 


} 
} 
printf("\n"); 
DestroyStack( st); // 销 毁 栈 
} 


3 后 序 汤 历 非 地 明 算 决 

后 序 遍 历 非 递归 算法 是 在 前 面 中 序 遍 历 非 递 归 算 法 的 基础 上 修改 的 ,后 序 遍历 顺序 是 
左 子 树 、 右 子 树 , 根 结 点 。 所 以 先 将 根 结 点 及 其 左下 结 点 依次 进 栈 , 即 使 栈 顶 结 点 的 左 子 
树 已 遍历 或 为 空 , 仍 还 不 能 访问 结 点 p, 因 为 它们 的 右 子 树 没有 遍历 ,只 有 当 这 样 的 p 结 点 
的 右 子 树 已 遍历 完 才能 访问 结 点 p。 后 序 遍 历 的 非 递 归 过 程 如 下 : 


{ ”while ( 结 点 p 有 左 孩 子 ) 

{ “将 结 点 p 进 栈 ; 
p=p—> lchild; 

} 

// 此 时 栈 顶 结 点 (尚未 访问 ) 没 有 左 孩 子 或 左 子 树 已 遍历 过 

while ( 栈 不 空 且 结 点 p 是 栈 顶 结 点 ) 

{ ” 取 栈 顶 结 点 p; 的 8 
主 ( 结 点 p 的 右 子 树 已 访问 ) bi 
{ 访问 结 点 p; 视频 讲解 

退 栈 ; 

















} 
else p=p—> rchild; // 转 向 处 理 其 右 子 树 
} 
} while ( 栈 不 空 ); 





需要 进一步 解决 以 下 两 个 问题 。 aa 


一 个 问题 是 如 何 判断 当前 处 理 的 结 点 p 是 栈 顶 结 点 ,这 个 比较 简单 ,设置 一 个 布尔 变 
量 flag, 在 do-while 循环 中 的 第 一 个 while 循环 结束 后 开始 处 理 栈 顶 结 点 , 置 flag 为 true; 
一 旦 转向 处 理 右 子 树 , 置 flag 为 false。 

另 一 个 问题 是 如 何 判断 结 点 p 的 右 子 树 已 遍历 过 ,这 是 算法 的 主要 难点 。 在 一 棵 二 又 
树 中 ,任何 一 棵 非 空 子 树 的 后 序 遍 历 序列 中 最 后 访问 的 一 定 是 该 子 树 的 根 结 点 ,也 就 是 说 ， 
若 结 点 户 的 右 孩 子 刚 刚 访 问 过 ,说 明 它 的 右 子 树 已 遍历 完 , 可 以 访问 结 点 如 了 。 当 然 , 若 结 
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点 了 的 右 孩 子 为 空 ,也 可 以 访问 结 点 p。 为 此 设置 一 个 指针 变量 ~, 其 初始 值 为 NULL, 让 
它 指向 刚刚 访问 过 的 结 点 。 对 于 正在 处 理 的 栈 顶 结 点 p ,一旦 p 一 > rchild 二 二 7 成立, 说 明 
结 点 p 的 左 、 右 子 树 都 遍历 过 了 ,将 可 以 访问 结 点 p。 





后 序 遍历 非 递 归 算 法 如 下 : 
void PostOrderl (BTNode * b) // 后 序 遍 历 非 递 归 算法 
{ BTNode *p,*r; 
bool flag; 
SqStack * st; // 定 义 一 个 顺序 栈 指针 st 
InitStack(st) ; // 初 始 化 栈 st 
p=b; 
do 
{while (p!=NULL) // 扫 描 结 点 p 的 所 有 左下 结 点 并 进 栈 
{ Push(st,p); // 结 点 p 进 栈 
p=p —> lchild; // 移 动 到 左 孩 子 
r=NULL:; //r 指 向 刚 访问 的 结 点 ,初始 时 为 空 
flag= true; //flag 为 真 表示 正在 处 理 栈 顶 结 点 
while (!StackEmpty(st) &&. flag) 
{ GetTop(st,p); // 取 出 当前 的 栈 顶 结 点 p 
if (p—> rchild==7r) // 若 结 点 p 的 右 孩 子 为 空 或 者 为 刚刚 访问 过 的 结 点 
{ printf("%c ",p 一 > data); ”// 访 问 结 点 p 
Pop(st, p); 
r=p; //r 指 向 刚 访问 过 的 结 点 
} 
else 
{ p=p 一 rchild; // 转 向 处 理 其 右 子 树 
flag= false; // 表 示 当 前 不 是 处 理 栈 顶 结 点 
} 
} 
} while (!StackEmpty(st)); // 栈 不 空 循环 
printf("\n"); 
DestroyStack( st) ; // 销 毁 栈 


} 


当 每 一 轮 外 循环 结束 时 ,所 有 栈 中 结 点 均 未 访问 但 它 的 左 子 树 已 遍历 (或 者 左 子 树 为 
空 ) ,等 待 遍历 其 右 子 树 并 访问 它 ; 所 以 一 旦 栈 空 ,表示 没有 任何 需要 访问 的 结 点 ,算法 结 
东 。 但 在 外 循环 之 前 没有 任何 结 点 进 栈 ,所 以 外 循环 采用 
do-while 循环 , 即 后 判断 栈 是 否 为 空 。 

例如 ,对 于 图 7.13(b) 所 示 的 二 又 树 , 其 后 序 遍历 非 递 
归 算 法 的 执行 过 程 如 表 7. 5 所 示 , 也 可 以 用 图 7. 19 来 
描述 。 

以 上 后 序 遍历 非 弟 归 算 法 有 这 样 的 特点 : 当 访 问 某 个 
结 点 时 , 栈 中 保存 的 正好 是 该 结 点 的 所 有 祖先 结 点 ,从 栈 顶 
到 栈 底 正好 是 该 结 点 的 双亲 结 点 到 根 结 点 逆 路 径 上 的 结 点 
序列 。 有 些 复杂 的 算法 是 利用 这 个 特点 求解 的 , 例 7. 17 就 
是 采用 了 这 个 特点 来 设计 算法 。 





7.19 后 序 遍历 非 递归 算法 
的 执行 过 程 
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表 7.5 后 序 非 递归 遍历 算法 的 执行 过 程 








执行 的 操作 访问 结 点 st( 栈 底 只 栈 顶 ) 
A、B,D 结 点 依次 进 栈 ABD 
取 栈 顶 结 点 p(D 结 点 ),D 结 点 的 右 子 树 未 遍历 ,p= 二 pp 一 > rchild,p 指向 pe 
G 结 点 
G 结 点 进 栈 ,p= 二 p 一 > lchild,p 王 NULL ABDG 
取 栈 顶 结 点 p(G 结 点 ) ,其 右 孩 子 为 空 ,访问 它 , 出 栈 G ABD 
取 栈 顶 结 点 p(D 结 点 ) ,其 右 孩子 为 刚 访问 的 G 结 点 ,访问 它 , 出 栈 D AB 
取 栈 顶 结 点 p(B 结 点 ) ,其 右 孩 子 为 空 ,访问 它 , 出 栈 B A 
取 栈 顶 结 点 p(A 结 点 ) ,A 结 点 的 右 子 树 未 遍历 ,p 二 p 一 > rchild,p 指向 六 
C 结 点 
C\E 结 点 依次 进 栈 ,p==p 一 > lchild,p=NULL ACE 
取 栈 顶 结 点 p(E 结 点 ) ,其 右 孩子 为 空 ,访问 它 ,出 栈 E AC 
取 栈 顶 结 点 p(C 结 点 ),C 结 点 的 右 子 树 未 遍历 ,p 二 pp 一 > rchild,p 指向 
F 结 点 A 
下 结 点 进 栈 ,p=p 一 > lchild,p 二 NULL ACF 
取 栈 顶 结 点 p(F 结 点 ) ,其 右 孩 子 为 空 ,访问 它 ,出 栈 F AC 
取 栈 顶 结 点 p(C 结 点 ) ,其 右 孩 子 为 刚 访问 的 F 结 点 ,访问 它 ,出 栈 C 矶 
取 栈 顶 结 点 p(A 结 点 ) ,其 右 孩 子 为 刚 访问 的 C 结 点 ,访问 它 , 出 栈 A 


栈 空 ,退出 外 循环 ,算法 结束 


【 例 7.17】 假设 二 又 树 采 用 二 又 链 存储 结构 ,设计 一 个 算法 输出 从 根 结 点 到 每 个 叶子 
结 点 的 路 径 逆 序列 ,要 求 采 用 后 序 遍 历 非 递归 算法 实现 。 

利用 后 序 遍历 非 递归 算法 的 特点 ,将 其 中 的 访问 结 点 改 为 判断 该 结 点 是 否 为 叶子 
结 点 ,若是 ,输出 栈 中 的 所 有 结 点 值 。 对 应 的 算法 如 下 : 


void AllPathl (BTNode * b) 
{ BTNode *p,*r; 





bool flag; 
SqStack * st; // 定 义 一 个 顺序 栈 指针 st 
InitStack( st) ; // 初 始 化 栈 st 
p=b; 
do 
{ while (p!=NULL) // 扫 描 结 点 p 的 所 有 左下 结 点 并 进 栈 
{ Push(st,p); // 结 点 p 进 栈 
p=p —> lchild; //p 移动 到 左 孩子 
} 
r=NULL; //r 指 向 刚 访问 的 结 点 ,初始 时 为 空 ns 
flag= true; //flag 为 真 表示 正在 处 理 栈 顶 结 点 
while (!StackEmpty(st) && flag) 
{ GetTop(st,p); // 取 出 当前 的 栈 顶 结 点 p 
if (p—> rchild==7) // 若 结 点 p 的 右 孩 子 为 空 或 者 为 刚 访问 过 的 结 点 
{ if(p-—>lIchild==NULL && p—> rchild==NULL) // 著 为 叶子 结 点 
{ // 输 出 栈 中 的 所 有 结 点 值 


for (int i=st —> top;i> 0;i——) 
printf(" %ec —>", st —> data[i] —> data) ; 
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printf("%e\n", st —> data[0] 一 > data); 


} 
Pop(st, p); 
r=p; //r 指 向 刚 访问 过 的 结 点 
} 
else 
{ p=p—> rchild; // 转 向 处 理 其 右 子 树 
flag= false; // 表 示 当 前 不 是 处 理 栈 顶 结 点 
} 
} 
} while (!StackEmpty(st)); // 栈 不 空 循环 


} 


对 于 图 7. 13(b) 所 示 的 二 叉 树 ,其 输出 结果 为 GD~~B 一 ~A、E~~C 一 A 和 F-~C-A 这 
3 条 道路 径 序列 。 
754 层次 遍历 算法 
在 进行 层次 遍历 时 ,对 某 个 结 点 访问 完 之 后 ,再 按照 它 的 左 、 右 孩子 顺 要 -和 
序 进行 同样 的 处 理 , 这 样 一 层 一 层 进行 。 先 访问 结 点 的 左 、 右 孩子 也 要 先 访 
问 ,这 样 与 队列 的 特征 相 吻 合 。 因 此 层次 遍历 算法 采用 一 个 环形 队列 qu 来 
算法 中 的 环形 队列 采用 顺序 队 存储 结构 ,其 类 型 声明 如 下 : 

















typedef struct 


{ BTNode * data[MaxSize] ; // 存 放 队 中 元 素 
int front, rear; // 队 头 和 队 尾 指针 
} SqQueue; // 顺 序 队 类 型 


相关 的 环形 队列 运算 算法 设计 见 3. 2. 2 小 节 。 

层次 遍历 过 程 是 先 将 根 结 点 进 队 ,在 队 不 空 时 循环 : 从 队列 中 出 列 一 个 结 点 p, 访 问 它 ; 
若 它 有 左 孩 子 结 点 ,将 左 孩 子 结 点 进 队 ; 若 它 有 右 孩 子 结 点 ,将 右 孩 子 结 点 进 队 。 如 此 操作 
直到 队 空 为 止 。 对 应 的 算法 如 下 : 


void LevelOrder(BTNode * b) 
{ BTNode *p; 


SqQueue * qu; // 定 义 环形 队列 指针 
InitQueue(qu) ; // 初 始 化 队列 
enQueue(qu, b); // 根 结 点 指针 进入 队列 
while (!QueueEmpty(qu)) // 队 不 为 空 循环 
{ deQueue(qu,p); // 出 队 结 点 p 
printf("%c ",p 一 > data) ; // 访 问 结 点 p 
if (p—> Ichild!= NULL) // 有 左 孩子 时 将 其 进 队 
enQueue(qu,p —> lchild) ; 
if (p—> rchild!= NULL) // 有 右 孩 子 时 将 其 进 队 


enQueue(qu,p —> rchild) ; 
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【 例 7.18】 采用 层次 遍历 方法 设计 例 7. 17 的 算法 。 
采用 类 似 于 3. 2.4 小 节 中 使 用 队列 求解 迷宫 问题 的 方法 ,这 里 设计 的 队列 为 非 环 
形 顺 序 队列 ,队列 的 类 型 声明 如 下 : 


typedef struct snode 


{ BTNode * pt; // 存 放 当 前 结 点 指针 
int parent; // 存 放 双 亲 结 点 在 队列 中 的 位 置 
} NodeType; // 非 环形 队列 元 素 类 型 


typedef struct 

NodeType data[MaxSize] ; ”// 存 放 队 列 元 素 

int front, rear; // 队 头 指 针 和 队 尾 指针 
} QuType; // 顺 序 队 类 型 


{ 


从 根 结 点 开始 层次 遍历 ,将 所 有 已 访问 过 的 结 点 进 队 ,并 在 队列 中 保存 其 双亲 结 点 的 位 
置 。 当 找到 一 个 叶子 结 点 时 ,在 队列 中 通过 双亲 结 点 的 位 置 输出 根 结 点 到 该 叶子 结 点 的 路 
径 的 逆序 列 。 对 应 的 算法 如 下 : 


void AllPath2(BTNode * b) 


int k; 
BTNode * p; 
NodeType qelem; 
QuType * qu; // 定 义 非 环形 队列 指针 
InitQueue(qu) ; // 初 始 化 队列 
qelem. pt=b; qelem. parent 一 一 1; // 创 建 根 结 点 对 应 的 队列 元 素 
enQueue( qu, qelem); // 根 结 点 进 队 
while (!QueueEmpty(qu)) // 队 不 空 循环 
{ deQueue(qu,qelem); // 出 队 元 素 qelem, 它 在 队 中 的 下 标 为 qu 一 > front 
p= qelem. pt; // 取 元 素 qelem 对 应 的 结 点 p 
if (p—> Ichild==NULL && p—> rchild==NULL) // 结 点 p 为 叶子 结 点 
{ k=qgu—> front; // 输 出 结 点 p 到 根 结 点 的 路 径 的 逆序 列 
while (qu 一 > data[k] .parent!= —1) 
{ printf("%c—>",qu—> data[k] .pt 一 > data); 
k= qu —> data[k] .parent; 
和 
printf("%ce\n", qu —> data[k] .pt 一 > data); 
} 
if (p> lchild!= NULL) // 结 点 pP 有 左 孩 子 
{ qelem.pt=p—> lchild; // 创 建 结 点 p 的 左 孩 子 对 应 的 队列 元 素 
qelem. parent 一 qu 一 > front; // 结 点 p 的 左 孩子 的 双亲 位 置 为 qu -> front 
enQueue(qu,qelem) ; // 结 点 p 的 左 孩子 进 队 
} 
if (p> rchild!=NULL) // 结 点 P 有 右 孩 子 
{ qelem.pt=p—> rchild; // 创 建 结 点 p 的 右 孩 子 对 应 的 队列 元 素 
qelem. parent 一 qu —> front; // 结 点 p 的 右 孩 子 的 双亲 位 置 为 qu -> front 


enQueue(qu, qelem) ; // 结 点 p 的 右 孩 子 进 队 
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对 于 图 7. 13(b) 所 示 的 二 又 树 ,其 输出 结果 为 EC-~A、F-~C~A 和 G 一 DB-~A 这 
3 条 逆 路 径 序列 。 


7.6 二叉树 的 构造 


假设 二 又 树 中 的 每 个 结 点 值 为 单个 字符 ,而 且 所 有 结 点 值 均 不 相同 (本 节 
的 算法 均 基 于 这 种 假设 ) ,同一 棵 二 叉 树 具有 唯一 先 序 序列 、 中 序 序列 和 后 序 
序列 ,但 不 同 的 二 叉 树 可 能 具有 相同 的 先 序 序列 .中 序 序列 和 后 序 序列 。 

例如 ,如 图 7. 20 所 示 的 5 棵 二 又 树 , 先 序 序列 都 为 ABC。 如 图 7.21 所 示 | 这 8 
的 5 棵 二 叉 树 ,中 序 序列 都 为 ACB。 如 图 7. 22 所 示 的 5 棵 二 叉 树 ,后 序 序列 视频 讲解 
都 为 CBA。 


A 

















(b) 
图 7.20 先 序 序列 为 ABC 的 5 棵 二 叉 树 


2 


(b) 
图 7.21 中 序 序列 为 ACB 的 5 棵 二 叉 树 


(DW (4) W 
@ 
(8) (8) (8) (8) 
GO 
(© (© (© (© 

(a) (b) (c) (d) (e) 


7.22 后 序 序列 为 CBA 的 5 棵 二 叉 树 


显然 , 仅 由 先 序 序列 、 中 序 序列 和 后 序 序列 中 的 任何 一 个 无 法 确定 这 棵 二 叉 树 的 树 形 。 
但 是 ,如 果 同 时 知道 了 一 棵 二 叉 树 的 先 序 序列 和 中 序 序列 ,或 者 同时 知道 了 中 序 序列 和 后 序 
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序列 ,就 能 确定 这 棵 二 又 树 。 

例如 , 先 序 序列 是 ABC ,而 中 序 序列 是 ACB 的 二 叉 树 必定 是 图 7. 20(c) 。 

类 似 地 ,中 序 序列 是 ACB, 而 后 序 序列 是 CBA 的 二 叉 树 必定 是 图 7. 21(c) 。 

但 是 ,同时 知道 先 序 序 列 和 后 序 序 列 仍 不 能 确定 二 又 树 的 树 形 ,例如 图 7. 20 和 图 7. 22 
中 除 第 一 棵 以 外 的 4 棵 二 又 树 的 先 序 序列 都 是 ABC ,后 序 序列 都 是 CBA。 

定理 7.1: 任何 n(n 三 0) 个 不 同 结 点 的 二 叉 树 ,都 可 由 它 的 中 序 序列 和 先 序 序列 唯一 地 
确定 。 
证 明 : 采用 数学 归纳 法 证 明 。 
当 n 二 0 时 ,二 叉 树 为 空 , 结 论 正确 。 
假设 结 点 数 小 于 的 任何 二 叉 树 都 可 以 由 其 先 序 序列 和 中 序 序列 唯一 
地 确定 。 

车 某 棵 二 叉 树 含有 n(n 记 0) 个 不 同 结 点 ,其 先 序 序 列 是 aoar…a,-1; 中 视频 讲解 
序 序列 是 加 加 … 和 -iD Oils 

因为 在 先 序 遍 历 过 程 中 访问 根 结 点 后 紧 跟 着 遍历 左 子 树 , 最 后 再 遍历 右 子 树 ,所 以 ao 
必定 是 二 叉 树 的 根 结 点 ,而 且 ao 必然 在 中 序 序列 中 出 现 。 也 就 是 说 ,在 中 序 序列 中 必 有 某 
个 b.(0 志 kn 一 1) 就 是 根 结 点 ao 。 

由 于 6b 是 根 结 点 ,而 在 中 序 遍历 过 程 中 先 遍 历 左 子 树 ,再 访问 根 结 点 ,最 后 再 遍历 右 子 
树 ,所 以 在 中 序 序列 中 bo54…bi-1 必 是 根 结 点 bi (也 就 是 ao ) 左 子 树 的 中 序 序列 , 即 b 的 左 
子 树 有 k 个 结 点 (注意 ,一 0 表示 结 点 bs 没有 左 子 树 ) ,而 w+ …-: 必 是 根 结 点 b 右 子 树 
的 中 序 序列 , 即 和 的 右 子 树 有 nn 一 & 一 1 个 结 点 (注意 ,k= 二 =n 一 1 表示 结 点 b 没有 右 子 树 ) 。 

另外 ,在 先 序 序列 中 , 紧 跟 在 根 结 点 we 之 后 的 人 个 结 点 序列 wm …ax 就 是 左 子 树 的 先 
序 序列 ,n 一 & 一 1 个 结 点 序列 arn4…as-1 就 是 右 子 树 的 先 序 序列 ,其 示意 图 如 图 7. 23 
所 示 。 




















通过 ao 在 中 序 序列 中 找到 bh。 





根 结 点 一 生根 结 点 
先 序 序列 : aoa … ”ak ar … ”or 中 序 序列 : bo bi bs be … bl 
左 子 树 先 序 右 子 树 先 序 左 子 树 中 序 。” 右 子 树 中 序 
序列 ， 有 k ”序列 ， 有 n-k-1 序列 ， 有 k 序列 ， 有 n-k-1 
个 结 点 个 结 点 个 结 点 个 结 点 


强 局 央 局 绍 忆 


图 7.23 由 先 序 序列 和 中 序 序列 确定 一 棵 二 叉 树 


根据 归纳 假设 ,由 于 子 先 序 序列 a1…as 和 子 中 序 序列 5ob1…bi-1 可 以 唯一 地 确定 根 结 
点 ao 的 左 子 树 ,而 子 先 序 序列 ws+…as-: 和 子 中 序 序列 w+ -可 以 唯一 地 确定 根 结 点 





ao 的 右 子 树 。 


综 上 所 述 , 这 棵 二 叉 树 的 根 结 点 已 经 确定 ,而 且 其 左 、 右 子 树 都 唯一 地 确定 了 ,所 以 整个 
二 叉 树 也 就 唯一 地 确定 了 。 

实际 上 , 先 序 序列 的 作用 是 确定 一 棵 二 叉 树 的 根 结 点 (其 第 一 个 元 素 即 为 根 结 点 ) ,中 序 
序列 的 作用 是 确定 左 、 右 子 树 的 中 序 序列 (包含 确定 其 含 的 结 点 个 数 ) ,进而 可 以 确定 左 、 布 
子 树 的 先 序 序列 。 再 递归 构造 左 、 右 子 树 。 





数据 结构 教程 利 昌 @ 





例如 ,已 知 先 序 序列 为 ABDGCEF, 中 序 序列 为 DGBAECF, 则 构造 二 又 树 的 过 程 如 
图 7. 24 所 示 。 
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: 空 左 中 序 ; 空 左 中 序 : 空 
右 中 序 : G 右 先 序 : 空 右 中 序 : 空 右 中 序 : 空 











图 7.24 由 先 序 序列 和 中 序 序列 构造 二 叉 树 的 过 程 
由 上 述 定理 得 到 以 下 构造 二 又 树 的 算法 : 


BTNode * CreateBT1(char * pre,char * in,int n) 
//pre 存放 先 序 序列 ,in 存放 中 序 序列 ,n 为 二 叉 树 的 结 点 个 数 ,本 算法 执行 后 返回 构造 的 二 叉 链 的 根 


// 结 点 指针 b 
{ BTNode *b; 
char *p; 
int k; 
if (n<=0) return NULL; 
b= (BTNode * )malloc(sizeof(BTNode) ) ; // 创 建 二 叉 树 结 点 b 
b 一 > data= * pre; 
for (p=in;p<in 十 n;p 十 十 ) // 在 中 序 序列 中 找 等 于 * pre 字符 的 位 置 k 
if (* p 一 一 * pre) //Ppre 指向 根 结 点 
break; // 在 in 中 找到 后 退出 循环 
k=p—in; // 确 定 根 结 点 在 in 中 的 位 置 
b 一 > lchild 一 CreateBT1(pre 十 1,in,k); // 递 归 构 造 左 子 树 
b 一 > rchild 王 CreateBT1(pre 十 k 十 1,p 十 1,n 一 k 一 1); // 递 归 构 造 右 子 树 
return b; 


} 





定理 7.2: 任何 xz 二 0) 个 不 同 结 点 的 二 又 树 都 可 由 它 的 中 序 序列 和 后 序 序列 唯一 地 
确定 。 
证 明 : 同样 采用 数学 归纳 法 证 明 。 9 
当 n=0 时 ,二 叉 树 为 空 ,结论 正确 。 党 
假设 结 点 数 小 于 的 任何 二 又 树 都 可 以 由 其 中 序 序列 和 后 序 序列 唯一 
地 确定 。 

















视频 讲解 
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已 知 某 棵 二 又 树 含 有 n(n 二 0) 个 不 同 结 点 ,其 中 序 序列 是 bo51…bi-1bib441…b,-1， 后 序 
序列 是 aoa1*…a,-1。 

因为 在 后 序 遍历 过 程 中 先 遍 历 左 子 树 , 再 遍历 右 子 树 , 最 后 访问 根 结 点 ,所 以 -必定 
是 二 叉 树 的 根 结 点 ,而 且 a,-1 必 然 在 中 序 序列 中 出 现 。 也 就 是 说 ,在 中 序 序列 中 必 有 某 个 
bi(0 三 kn 一 1) 就 是 根 结 点 a, -1。 

由 于 6b 是 根 结 点 ,而 在 中 序 遍 历 过 程 中 先 遍 历 左 子 树 ,再 访问 根 结 点 ,最 后 再 遍历 右 子 
树 , 所 以 在 中 序 序列 中 560…6-1 必 是 根 结 点 bi (也 就 是 a,-1) 左 子 树 的 中 序 序列 , 即 和 的 左 
子 树 有 k 个 结 点 (注意 ,k==0 表示 结 点 bs 没有 左 子 树 ) ,而 B44…b,-1 必 是 根 结 点 bs 右 子 树 
的 中 序 序列 , 即 b 的 右 子 树 有 nn 一 & 一 1 个 结 点 (注意 ,k= 二 n 一 1 表示 结 点 bi 没有 右 子 树 ) 。 

另外 ,在 后 序 序 列 中 ,在 根 结 点 a,-! 之 前 的 n 一 k 一 1 个 结 点 序列 a,…a,-: 就 是 右 子 树 的 
后 序 序列 ,k 个 结 点 序列 ao…as-! 就 是 左 子 树 的 后 序 序列 ,其 示意 图 如 图 7. 25 所 示 。 


通过 a 在 中 序 序列 
结 点 下 一 一 一 一 一 一 根 结 点 
根 结 ， 中搜 到 Br 根 纪 
后 序 序列 : aoal … ”ae ak … Gan2 om- 中 序 序列 : pop 2 0 

ee he Ea etn 
左 子 树 后 序 右 子 树 后 序 左 子 树 中 序 。” 右 子 树 中 序 
序列 ， 有 k 序列， 有 n-k-1 序列 ， 有 k 序列 ， 有 ml 
个 结 点 个 结 点 个 结 点 个 结 点 


图 7.25 由 后 序 序列 和 中 序 序列 确定 一 棵 二 叉 树 


根据 归纳 假设 , 子 中 序 序列 5。…b-1 和 子 后 序 序列 co…axs-i 可 以 唯一 地 确定 根 结 点 b 
(也 就 是 a,-1) 的 左 子 树 ,而 子 中 序 序列 B44…b,-1 和 子 后 序 序列 we…as-* 可 以 唯一 地 确定 
根 结 点 和 的 右 子 树 。 

综 上 所 述 , 这 棵 二 叉 树 的 根 结 点 已 经 确定 ,而 且 其 左 、 右 子 树 都 唯一 地 确定 了 ,所 以 整个 
二 叉 树 也 就 唯一 地 确定 了 。 

例如 ,已 知 中 序 序列 为 DGBAECF, 后 序 序列 为 GDBEFCA, 则 构造 二 叉 树 的 过 程 如 
图 7.26 所 示 。 





根 结 点 : A 
左 中 序 : DGB 左 后 序 : GDB 
右 中 序 : ECF 右 后 序 : EFC 
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根 结 点 : B 根 结 点 : C 

左 中 序 : DG 左 后 序 : GD| 左 中 序 : E 左 后 序 : E 

右 中 序 : 空 右 后 序 : 空 右 中 序 : F 右 后 序 : F 
根 结 点 : D 根 结 点 : E 根 结 点 : F ~ 
左 中 序 : 空 左 后 序 : 空 左 中 序 : 空 左 后 序 : 空 | | 左 中 序 : 空 左 后 序 : 空 
右 中 序 : G 右 后 序 : G 右 中 序 : 空 右 后 序 : 空 | | 右 中 序 : 空 右 后 序 : 空 
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【 例 7. 19】 


对 


REED 了 OO 


由 上 述 定理 得 到 以 下 构造 二 又 树 的 算法 : 


BTNode * b; 

char r, * p; 

int k; 

if (n<=0) return NULL; 
r= #* (posti+n—1); 


b= (BTNode * )malloc(sizeof(BTNode) ) ; 


b—> data=r; 
for (p=in;p<int+n;p 二 十) 
if (* p==r) break; 
k=p—in; 
b—> lchild= CreateBT2 (post, in, k) ; 


BTNode * CreateBT2(char * post, char * in,int n) 
/* post 存放 后 序 序列 ,in 存放 中 序 序列 ,n 为 二 叉 树 结 点 个 数 ,本 算法 执行 后 返回 构造 的 二 叉 链 的 根 
结 点 指针 bx / 


b 一 rchild 王 CreateBT2(post 十 k,p 十 1,n 一 k 一 1); 


return b; 


fla,i) =NULL 
fla,i) =NULL 
f(a, 引 二 b( 创 建 根 结 点 5, 其 data 值 为 a[]); 


b—>lchild= f(a,2*7); 
b—>rchild= f(a,2*i+1) 


应 的 递归 算法 如 下 : 


BTNode * trans(SqBTree a, int i) 


BTNode * b; 
if (i> MaxSize) 
return(NULL); 
if (a[] =='# ')return( NULL); 


b= (BTNode * )malloc(sizeof(BTNode) ) ; 


b—> data=a[]; 
b—>1child=trans(a, 2*)); 
b—>rchild=trans(a,2*i+1); 


return(b); 


i 大 于 MaxSize 
i 对 应 的 结 点 为 空 , 即 a[ 疏 二 '#' 


其 他 情况 


// 根 结 点 值 
// 创 建 二 叉 树 结 点 b 


// 在 in 中 查找 根 结 点 
//k 为 根 结 点 在 in 中 的 下 标 


// 递 归 构造 左 子 树 
// 递 归 构 造 右 子 树 


设计 一 个 算法 ,将 二 又 树 的 顺序 存储 结构 转换 成 二 又 链 存储 结构 。 
设 二 又 树 的 顺序 存储 结构 为 a, 由 f(a, 让 返 回 创建 的 以 a[ 门 为 根 结 点 的 二 又 链 存 
储 结构 (初始 调用 为 5 三 f(a,1))。 转 换 过 程 对 应 的 递归 模型 如 下 : 

















// 空 结 点 返回 NULL 
// 创 建 根 结 点 b 


// 递 归 创建 左 子 树 
// 递 归 创 建 右 子 树 
// 返 回 根 结 点 
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线索 二 叉 树 hs 


771 线索 二 又 树 的 概念 


对 于 具有 个 结 点 的 二 又 树 , 当 采用 二 叉 链 存储 结构 时 ,每 个 结 点 有 两 个 指针 域 ,总 共 
有 2n 个 指针 域 ,又 由 于 只 有 一 1 个 结 点 被 有 效 指针 域 所 指向 (2 个 结 点 中 只 有 根 结 点 没有 
被 有 效 指针 域 指向 ), 则 共有 2n 一 (n 一 1) 二 nn 十 1 个 空 链 域 。 
遍历 二 又 树 的 结果 是 一 个 结 点 的 线性 序列 ,可 以 利用 这 些 空 链 域 存放 指向 结 点 的 前 驱 
结 点 和 后 继 结 点 的 地 址 。 其 规定 是 当 某 结 点 的 左 指针 为 空 时 , 令 该 指针 指向 这 个 线性 序列 
中 该 结 点 的 前 驱 结 点 ; 当 某 结 点 的 右 指 针 为 空 时 , 令 该 指针 指向 这 个 线性 序列 中 该 结 点 的 
后 继 结 点 ,这 样 的 指向 该 线性 序列 中 的 “前 驱 结 点 "和 “后 继 结 点 ”的 指针 称 为 线索 (thread) 。 
创建 线索 的 过 程 称 为 线索 化 。 线 索 化 的 二 又 树 称 为 线索 二 叉 树 (threaded binary-tree) 。 
由 于 遍历 方式 不 同 ,产生 的 遍历 线性 序列 也 不 同 ,会 得 到 相应 的 线索 二 叉 树 。 一 般 有 先 
序 线索 二 又 树 .中 序 线索 二 又 树 和 后 序 线索 二 又 树 。 创 建 线索 二 又 树 的 目的 是 提高 该 遍历 
过 程 的 效率 。 
那么 ,在 线索 二 叉 树 中 如 何 区 分 左 指针 指向 的 是 左 孩 子 结 点 还 是 前 驱 结 点 , 右 指针 指向 
的 是 右 孩 子 结 点 还 是 后 继 结 点 呢 ? 为 此 ,在 结 点 的 存储 结构 上 增加 两 个 标志 位 来 区 分 这 两 
种 情况 : 
0 ”表示 lchild 指向 左 孩 子 结 点 
1 表示 lchild 指向 前 驱 结 点 
0 表示 rchild 指向 右 孩 子 结 点 


右 标志 rtag 一 中 
1 表示 rchild 指向 后 继 结 点 


这 样 ,每 个 结 点 的 存储 结构 如 下 : 


ltag lchild data rchild rtag 


在 某 遍 历 方式 的 线索 二 叉 树 中 , 若 开始 结 点 p 没有 左 孩 子 , 将 p 结 点 的 左 指针 改 为 线 
索 , 其 左 指针 仍 为 空 ; 若 最 后 结 点 g 没有 右 孩 子 ,将 gq 结 点 的 右 指针 改 为 线索 ,其 右 指 针 仍 
为 空 。 对 于 其 他 结 点 +, 若 它 没有 左 孩 子 ,将 左 指针 改 为 指向 前 驱 结 点 的 非 空 线索 ; 若 它 没 
有 右 孩 子 , 将 右 指针 改 为 指向 后 继 结 点 的 非 空 线索 。 

为 使 创建 线索 二 叉 树 的 算法 设计 方便 ,在 线索 二 叉 树 中 再 增加 一 个 头 结 点 。 头 结 点 的 
data 域 为 空 ; lchild 指向 无 线索 时 的 根 结 点 ,ltag 为 0; rchild 指向 按 某 种 方式 遍历 二 叉 树 时 





左 标志 ltag 









































的 最 后 一 个 结 点 ,rtag 为 1。 图 7. 27 为 图 7. 13(a) 所 示 的 二 叉 树 的 线索 二 叉 树 ,其 中 ， aa 


图 7. 27(a) 是 中 序 线索 二 又 树 (中 序 序列 为 DGBAECF) ,图 7.27(b) 是 先 序 线索 二 又 树 ( 先 
序 序列 为 ABDGCEF) ,图 7.27(c) 是 后 序 线索 二 又 树 ( 后 序 序列 为 GDBEFCA)。 图 中 的 实 
线 表示 二 又 树 原 来 指针 所 指 的 结 点 ,虚线 表示 线索 二 又 树 所 添加 的 线索 。 


772 线索 化 二 叉 树 


建立 线索 二 叉 树 ,或 者 说 对 二 又 树 线索 化 ,实际 上 就 是 遍历 一 棵 二 又 树 , 在 遍历 的 过 程 
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(a) 中 序 线索 树 (b) 先 序 线索 树 
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(ec) 后 序 线索 树 
图 7.27 线索 二 叉 树 


中 检查 当前 结 点 的 左 、 右 指针 域 是 否 为 空 , 如 果 为 空 ,将 它们 改 为 指向 前 驱 结 点 或 后 继 结 点 
的 线索 。 


为 了 实现 线索 化 二 叉 树 ,将 前 面 二 叉 树 结 点 的 类 型 声明 修改 如 下 : 


typedef struct node 


{ ElemType data; // 结 点 数据 域 
int ltag, rtag; // 增 加 的 线索 标记 
struct node * lchild; // 左 孩子 或 线索 指针 
struct node * rchild; // 右 孩子 或 线索 指针 
} TBTNode; // 线 索 二 叉 树 中 的 结 点 类 型 
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下 面 以 中 序 线索 二 又 树 为 例 讨 论 建立 线索 二 

CreateThread(5) 算 法 的 功能 是 将 以 二 又 链 存 储 的 二 又 树 0 进行 中 序 线索 化 ,并 返回 线 
索 化 后 头 结 点 的 指针 root。Thread(p) 算 法 的 功能 是 对 以 结 点 p 为 根 的 二 叉 树 进行 中 序 线 
索 化 。 在 整个 算法 中 p 总 是 指向 当前 被 线索 化 的 结 点 ,而 pre 作为 全 局 变量 ,指向 刚 访问 过 
的 结 点 , 结 点 pre 是 结 点 p 的 前 驱 结 点 , 结 点 p 是 结 点 pre 的 后 继 结 点 。 

CreateThread(b) 算 法 的 思路 是 先 创 建 头 结 点 root, 其 lchild 域 为 链 指 针 , rchild 域 为 线 
索 。 将 lchild 指针 指向 根 结 点 2, 如果 “为 空 , 则 将 其 lchild 指向 自身 ,否则 将 root 的 lchild 
指向 结 点 5, 首先 p 指向 结 点 5 ,pre 指向 头 结 点 root。 再 调用 Thread(5b) 对 整个 二 又 树 线索 
化 ,最 后 加 入 指向 头 结 点 的 线索 ,并 将 头 结 点 的 rchild 指针 域 线索 化 为 指向 最 后 一 个 结 点 
(由 于 线索 化 直到 p 等 于 NULL 为 止 ,所 以 最 后 访问 的 结 点 是 pre)。 


Thread(p) 算 法 类 似 于 中 序 遍 历 的 递归 算 
法 。 在 中 序 遍历 中 ,p 指向 当前 访问 的 结 点 ， 
pre 指向 中 序 遍历 的 前 一 个 结 点 (初始 时 , pre 
指向 中 序 线 索 二 叉 树 的 头 结 点 root) 。 若 结 点 
原来 左 指针 为 空 , 改 为 指向 结 点 pre 的 左 线 
索 , 若 结 点 pre 原来 右 指 针 为 空 , 改 为 指向 结 点 
Zp 的 右 线索 ,如 图 7.28 所 示 。 

中 序 线索 二 又 树 的 算法 如 下 : 


TBTNode * pre; 
void Thread( TBTNode * &p) 
{ if(p!=NULL) 
{ Thread(p—> 1child); 
if (p—> lchild== NULL) 
{ p—>lchild=pre; 
p—>ltag=1; 
} 
else 
p—>ltag=0; 
if (pre —> rchild== NULL) 
{ pre—>rchild=p; 
pre 一 > rtag=1; 
} 
else 
pre 一 > rtag=0; 
Pre 一 P; 
Thread(p 一 rchild) ; 
} 
} 
TBTNode * CreateThread(TBTNode * b) 
{ TBTNode * root; 


root= (TBTNode * )malloc(sizeof(TBTNode)); 


root 一 ltag 一 0;root 一 > rtag=1; 
root —> rchild 一 b; 
if (b==NULL) 
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改 为 指向 
结 点 p 的 右 线 索 


和 为 空 
结 点 pre 的 左 线索 


图 7.28 将 空 指针 改 为 线索 的 过 程 


// 全 局 变量 
// 对 二 叉 树 p 进行 中 序 线索 化 


// 左 子 树 线索 化 

// 左 孩子 不 存在 ,进行 前 驱 结 点 线索 化 
// 建 立 当前 结 点 的 前 驱 结 点 线索 

//p 结 点 的 左 子 树 已 线索 化 


// 对 pre 的 后 继 结 点 线索 化 
// 建 立 前 驱 结 点 的 后 继 结 点 线索 





// 右 子 树 线索 化 


// 中 序 线索 化 二 叉 树 


// 创 建 头 结 点 


// 空 二 叉 树 


\@9@ 


root —> lchild= root; 


else 

{ root—>lchild=b; 
pre 一 root; //pre 是 结 点 p 的 前 驱 结 点 , 供 加 线索 用 
Thread(b); // 中 序 遍 历 线索 化 二 叉 树 
pre 一 > rchild= root; // 最 后 处 理 ,加 入 指向 头 结 点 的 线索 
pre 一 > rtag 一 1; 
root —> rchild= pre; // 头 结 点 右 线索 化 

} 

return root; 





773 遍历 线索 化 二 叉 树 


遍历 某 种 次 序 的 线索 二 叉 树 就 是 从 该 次 序 下 的 开始 结 点 出 发 ,反复 找 
到 该 结 点 在 该 次 序 下 的 后 继 结 点 ,直到 头 结 点 。 Ty 

下 面 仍然 以 中 序 线索 二 又 树 的 中 序 遍历 为 例 进 行 讨论 。 在 中 序 线索 二 ly 
叉 树 中 ,开始 结 点 是 根 结 点 的 最 左下 结 点 ,该 结 点 的 左 指针 域 为 线索 (指向 头 结 点 的 线索 )， 
即 ltag 王 1, 所 以 找 开 始 结 点 的 过 程 如 下 : 














Pp 指向 根 结 点 ; 
while (p —> ltag==0) 
p=p—> lchild; 


当 找 到 开始 结 点 ( 即 结 点 p) 后 访问 它 。 如 果 结 点 户 的 右 指 针 是 右 线 索 , 说 明 右 线索 指向 
的 是 后 继 结 点 ,就 移 到 后 继 结 点 并 访问 ; 如 果 结 点 p 的 右 指 针 不 是 右 线 索 , 它 指 向 的 是 右 子 
树 ,就 转向 右 子 树 。 对 右 子 树 的 遍历 和 对 整个 二 叉 树 的 遍历 是 相似 的 ,所 以 中 序 遍 历 过 程 如 下 : 


p 指向 根 结 点 ; 
while p 取 root 时 循环 
{ 。 找 开始 结 点 p; 
访问 p 结 点 ; 
while (p 结 点 有 右 线索 ) 
一 直 访问 下 去 ; 
Pp 转向 右 孩子 结 点 ; // 不 是 右 线索 的 情况 





} 
对 应 的 算法 如 下 : 


void ThInOrder( TBTNode * tb) // 了 hb 指向 中 序 线索 二 叉 树 的 头 结 点 
{ TBTNode * p=tb—> 1child; //p 指向 根 结 点 
while (p!=tb) 
{ while (p—>ltag==0) p=p—> lchild; // 找 开始 结 点 
printf("%c",p 一 > data); // 访 问 开 始 结 点 
while (p 一 rtag 一 一 1 && p 一 rchild!=tb) 
{ p=p—> rchild; 
printf("%e",p—> data); 





} 
p=p—> rchild; 
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} 


显然 ,该 算法 是 非 递归 的 ,其 中 也 没有 使 用 栈 。 尽 管 时 间 复 杂 度 仍然 为 O(n) (n 为 二 叉 
树 中 的 结 点 个 数 ) ,但 空间 效率 得 到 提高 ,空间 复杂 度 为 O(1) 。 


哈 夫 曼 树 


781 哈 夫 曼 树 概述 


在 许多 应 用 中 经 常 将 树 中 的 结 点 赋予 一 个 有 某 种 意义 的 数值 , 称 此 数值 为 该 结 点 的 权 。 
从 根 结 点 到 该 结 点 之 间 的 路 径 长 度 与 该 结 点 上 权 的 乘积 称 为 结 点 的 带 权 路 径 长 度 
(Weighted Path Length,WPL)。 树 中 所 有 叶子 结 点 的 带 权 路 径 长 度 之 和 扫 -- 扫 
称 为 该 树 的 带 权 路 径 长 度 ,通常 记 为 : 国税 














WPL = Dw 党 

其 中 ,no 表示 叶子 结 点 的 个 数 ,zw 和 1; 分 别 表示 第 i 个 叶子 结 点 的 权 值 和 视频 讲解 
根 到 它 之 间 的 路 径 长 度 ( 即 从 根 结 点 到 该 叶子 结 点 的 路 径 上 经 过 的 分 支 数 ) 。 

在 mm 个 带 权 叶子 结 点 构成 的 所 有 二 叉 树 中 , 带 权 路 径 长 度 WPL 最 小 的 二 又 树 称 为 
哈 夫 曼 树 (Huffman tree) 或 最 优 二 又 树 。 因 为 构造 这 种 树 的 算法 最 早 是 由 喻 夫 曼 于 1952 
年 提出 的 ,所 以 用 他 的 名 字 命 名 。 

例如 ,给 定 4 个 叶子 结 点 , 设 其 权 值 分 别 为 1.3、5、7, 可 以 构造 出 形状 不 同 的 4 棵 二 叉 
树 , 如 图 7. 29 所 示 。 它 们 的 带 权 路 径 长 度 分 别 如 下 : 

(a) WPL=1X2 十 3X2 十 5X2 十 7X2 一 32 

(b) WPL 王 1X2 十 3X3 十 5X3 十 7X1 王 33 

(ec) WPL=7X3+5X3+3X2+1X1=43 

(d) WPL=1X3+3X3+5X2+7X1=29 

由 此 可 见 , 对 于 一 组 具有 确定 权 值 的 叶子 结 点 可 以 构造 出 多 个 具有 不 同 带 权 路 径 长 度 
的 二 叉 树 。 可 以 证 明 , 图 7.29(d) 所 示 的 二 叉 树 是 一 棵 哈 夫 曼 树 , 它 的 带 权 路 径 长 度 最 小 。 
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7.29 由 4 个 叶子 结 点 构成 的 不 同 的 带 权 二 叉 树 
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782 哈 夫 曼 树 的 构造 算法 

那么 给 定 m 个 权 值 ,如 何 构造 一 棵 含有 no 个 带 有 给 定 权 值 的 叶子 结 点 的 二 叉 树 ,使 其 
带 权 路 径 长 度 WPL 最 小 呢 ? 哈 夫 曼 最 早 给 出 了 一 个 带 有 一 般 规 律 的 算法 , 称 为 哈 夫 曼 算 
法 。 哈 夫 曼 算法 如 下 : 

(1) 根据 给 定 的 m 个 权 值 Czm ,tws，… ,ro ) ,对 应 结 点 构成 wm 棵 二 又 树 的 森林 下 一 
(Ti,T Tu), 其 中 每 棵 二 叉 树 T; (1 二 i 二 nm ) 中 都 只 有 一 个 带 权 值 为 w; 的 根 结 点 ,其 
左 、 右 子 树 均 为 空 。 

(2) 在 森林 下 中 选取 两 棵 结 点 的 权 值 最 小 的 子 树 分 别 作 为 左 、 右 子 树 构 造 一 棵 新 的 二 
叉 树 ,并 且 置 新 的 二 又 树 的 根 结 点 的 权 值 为 其 左右 子 树 上 根 的 权 值 之 和 。 

(3) 在 森林 下 中 ,用 新 得 到 的 二 又 树 代替 这 两 棵 树 。 

(4) 重复 (2) 和 (3) ,直到 下 只 含 一 棵 树 为 止 。 这 棵 树 便 是 哈 夫 曼 树 。 

例如 ,假设 仍 采 用 上 例 中 给 定 的 权 值 W=(1,3,5,7) 来 构造 一 棵 喻 夫 曼 树 ,按照 上 述 算 
法 , 则 图 7. 30 给 出 了 一 棵 哈 夫 曼 树 的 构造 过 程 ,其 中 图 7. 30(d) 就 是 最 后 生成 的 哈 夫 曼 树 ， 
它 的 带 权 路 径 长 度 为 29。 
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(a) (b) 
图 7.30 构造 哈 夫 曼 树 的 过 程 
定理 7.3: 对 于 具有 no 个 叶子 结 点 的 哈 夫 曼 树 ,共有 2 一 1 个 结 点 。 


证 明 : 在 哈 夫 曼 树 的 构造 过 程 中 ,每 次 都 是 将 两 棵 树 合并 为 一 棵 树 , 所 以 喻 夫 曼 树 中 不 
存在 度 为 1 的 结 点 , 即 m 二 0。 由 二 又 树 的 性 质 1 可 知 二 7 十 1, 即 二 wo 一 1, 则 n= 二 mo 十 
1 十 ?2 一 10 十 nz 二 m0 十 no 一 1 二 2no 一 1。 

为 了 实现 构造 哈 夫 曼 树 的 算法 ,设计 哈 夫 曼 树 中 的 结 点 类 型 如 下 : 











typedef struct 


{ char data; // 结 点 值 
double weight; // 权 重 
int parent; // 双 亲 结 点 
int lchild; // 左 孩子 结 点 
int rchild; // 右 孩子 结 点 
} HTNode; 


用 ht[ ] 数 组 存放 哈 夫 曼 树 ,对 于 具有 no 个 叶子 结 点 的 哈 夫 曼 树 ,总 共有 2no 一 1 个 结 
点 。 其 算法 思路 是 ,no 个 叶子 结 点 (存放 在 htL0] 一 ht[Lz 一 1] 中 ) 只 有 data 和 weight 域 值 ， 
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先 将 2n 一 1 个 结 点 的 parent、lchild 和 rchild 域 置 为 初 值 一 1。 然 后 处 理 每 个 非 叶子 结 点 
ht[ 让 (存放 在 ht[zo] 一 htL2z 一 2 中): 从 ht[L0] 一 ht 一 2 中 找 出 根 结 点 (其 parent 域 为 
一 1) 最 小 的 两 个 结 点 htLlnode] 和 ht[rnode], 将 它们 作为 ht[ 疏 的 左 、 右 子 树 ,将 htLlnode] 和 
htLrnode] 的 双亲 结 点 置 为 ht[ 门 ,并 且 ht[i]. weight 二 ht[lnode]. weight 十 ht[rnode]. weight。 如 
此 这 样 直到 no 一 1 个 非 叶子 结 点 处 理 完毕 。 构 造 哈 夫 曼 树 的 算法 如 下 : 

void CreateHT(HTNode ht[] ,int n0) 


{ inti,k,lnode,rnode; 
double minl ,min2; 





for (i=0;i<2*n0—1;it+) // 所 有 结 点 的 相关 域 置 初 值 一 1 
ht 器 .parent=ht[i] .lchild= ht[] .rchild 王 一 1; 
for (i=n0;i<=2* n0 一 2;i 十 十 ) // 构 造 哈 夫 曼 树 的 n0 一 1 个 分 支 结 点 
{ minl=min2=32767; //lnode 和 rnode 为 最 小 权重 的 两 个 结 点 位 置 
lnode=rnode=—1; 
for (k=0;k<=i—1;k+ 十 ) // 在 ht[0..i 一 1] 中 找 权 值 最 小 的 两 个 结 点 
if (ht[k] . parent==—1) // 只 在 尚未 构造 二 叉 树 的 结 点 中 查找 


{ if (ht[k].weight<minl) 
{ min2=minl;rnode= lnode; 
minl=ht[k]. weight;lnode 一 k; 
else if (ht[k] . weight < min2) 
{ min2 王 ht[k] .weight;rnode 一 k; } 
} 
ht[] .weight=ht[lnode] . weight 十 ht[rnode] . weight; 
ht 加 .lehild= Inode; ht[] . rchild= rnode; //ht 中 作为 双亲 结 点 
ht[lnode] . parent=i;ht[rnode] .parent=i; 


783 哈 夫 曼 编 码 


在 数据 通信 中 ,经 常 需要 将 传送 的 文字 转换 为 二 进 制 字 符 0 和 1 组 成 的 二 进 制 字符 串 ， 
称 这 个 过 程 为 编码 。 显 然 ,我 们 希望 电文 编码 的 代码 长 度 最 短 。 哈 夫 曼 树 可 用 于 构造 使 电 
文 编码 的 代码 长 度 最 短 的 编码 方案 。 

具体 构造 方法 如 下 : 设 需 要 编码 的 字符 集合 为 {di ,dz ,…:cdw} ,各 个 字符 在 电文 中 出 
现 的 次 数 集合 为 {wi wo，… ,tos ) ,以 di ,ds，…,d, 作 为 叶子 结 点 ,以 wi ,ws，… ,rw 作为 各 
根 结 点 到 每 个 叶子 结 点 的 权 值 构造 一 棵 哈 夫 曼 树 ,规定 哈 夫 曼 树 中 的 左 分 支 为 0、 右 分 支 为 
1, 则 从 根 结 点 到 每 个 叶子 结 点 所 经 过 的 分 支 对 应 的 0 和 1 组 成 的 序列 便 是 该 结 点 对 应 字符 
的 编码 。 这 样 的 编码 称 为 哈 夫 曼 编 码 (Huffman coding) 。 

哈 夫 曼 编 码 的 实质 就 是 使 用 频率 越 高 的 字符 采用 越 短 的 编码 。 

为 了 实现 构造 哈 夫 曼 编码 的 算法 ,设计 存放 每 个 结 点 的 哈 夫 曼 编码 的 类 型 如 下 : 





typedef struct 
{ char cd[N]; // 存 放 当 前 结 点 的 哈 夫 曼 码 

int start; // 表 示 cd[start..n0] 部 分 是 喻 夫 曼 码 
} HCode; 














视频 讲解 
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由 于 喻 夫 曼 树 中 每 个 叶子 结 点 的 喻 夫 曼 编码 长 度 不 同 ,为 此 采用 HCode 类 型 变量 的 
cdLstart..no ] 存 放 当 前 结 点 的 喻 夫 曼 码 , 只 需 对 叶子 结 点 求 喻 夫 曼 编码 。 对 于 当前 叶子 结 
点 ht[ 门 , 先 将 对 应 的 喻 夫 曼 码 hcd[ 门 的 start 域 值 置 初 值 zw, 找 其 双亲 结 点 ht[ 门 , 若 当 前 
结 点 是 双亲 结 点 的 左 孩子 结 点 , 则 在 hcd[ 疏 的 cd 数组 中 添加 0, 若 当前 结 点 是 双亲 结 点 的 
右 孩 子 结 点 , 则 在 hcd[ 详 的 cd 数组 中 添加 1, 并 将 start 域 减 1。 再 对 双亲 结 点 进行 同样 
的 操作 ,如 此 这 样 直到 无 双亲 结 点 ( 即 到 达 根 结 点 ), 所 以 start 指向 哈 夫 曼 编码 最 开始 的 
字符 。 

根据 哈 夫 曼 树 求 对 应 的 哈 夫 曼 编码 的 算法 如 下 : 


void CreateHCode( HTNode ht[], HCode hcd[] ,int n0) 
人 
HCode he; 
for (i=0;i<n0;i+ 十 ) // 根 据 哈 夫 曼 树 求 哈 夫 曼 编码 
{ he.start=n0;c=i; 
f=ht[] .parent; 


while (fl 一 一 1) // 循 环 直到 无 双亲 结 点 , 即 到 达 根 结 点 
{ if (ht[f.lchild==¢) // 当 前 结 点 是 双亲 结 点 的 左 孩 子 
he.cd[he. start 一 一 ] 一 '0'; 
else // 当 前 结 点 是 双亲 结 点 的 右 孩 子 
hec.cd[hc. start 一 一 ] 一 '1'; 
c=f;f=ht[{] .parent; // 再 对 双亲 结 点 进行 同样 的 操作 
} 
he. start 十 十 ; /Vstart 指向 哈 夫 曼 编码 最 开始 的 字符 
hcd[]=he; 


哈 夫 曼 编码 的 平均 长 度 = >)di X rw。 
一 1 


说 明 : 在 一 组 字符 的 哈 夫 曼 编 码 中 , 任 一 字符 的 哈 夫 曼 编 码 不 可 能 是 另 一 字符 哈 夫 曼 
编码 的 前 级 。 

【 例 7.20】 假设 用 于 通信 的 电文 仅 由 a、b、c、d、e、f、g、h 几 个 字母 组 成 ,字母 在 电文 中 
出 现 的 频率 分 别 为 0.07、0.19、0.02、0.06、0.32、0.03、0.21 和 0. 10 , 试 为 这 些 字母 设计 哈 
夫 曼 编码 。 

构造 哈 夫 曼 树 的 过 程 如 下 。 

第 1 步 选择 频率 最 低 的 c 和 f 构 造 一 棵 二 又 树 , 其 根 结 点 的 频率 为 0.05, 记 为 结 点 di; 

第 2 步 选 择 频率 低 的 di 和 d 构造 一 棵 二 又 树 ,其 根 结 点 的 频率 为 0. 11, 记 为 结 点 心 ， 

第 3 步 选择 频率 低 的 a 和 h 构造 一 棵 二 又 树 ,其 根 结 点 的 频率 为 0. 17, 记 为 结 点 ds; 

第 4 步 选择 频率 低 的 d。 和 ds 构造 一 棵 二 叉 树 ,其 根 结 点 的 频率 为 0. 28, 记 为 结 点 ds 

第 5 步 选 择 频率 低 的 2 和 8g 构造 一 棵 二 叉 树 ,其 根 结 点 的 频率 为 0.4, 记 为 结 点 ds; 

第 6 步 选择 频率 低 的 d, 和 e 构造 一 棵 二 又 树 ,其 根 结 点 的 频率 为 0. 6, 记 为 结 点 du; 

第 7 步 选 择 频率 低 的 ds 和 ds 构造 一 棵 二 叉 树 ,其 根 结 点 的 频率 为 1. 0, 记 为 结 点 d;。 

最 后 构造 的 哈 夫 曼 树 如 图 7. 31 所 示 ( 树 中 的 叶子 结 点 用 圆 或 椭圆 表示 ,分 支 结 点 用 和 矩 
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形 表示 ,其 中 的 数字 表示 结 点 的 频率 ) ,给 所 有 的 左 分 支 加 上 0, 给 所 有 的 右 分 支 加 上 1, 从 而 


得 到 各 字母 的 哈 夫 曼 编码 如 下 。 
a: 1010 b: 00 c: 10000 d: 1001 
e: 11 f: 10001 g: 01 h: 1011 





























图 7.31 一 棵 哈 夫 曼 树 


这 样 ,该 棵 哈 夫 曼 树 的 带 权 路 径 长 度 WPL=4X0.07 十 2X0.19 十 5X0.02 十 4X0. 06 十 
2X0,.32 十 5X0.03 十 2X0.21 十 4X0.1 一 2.61。 


用 并 查 集 求 解 等 价 问题 ”六 


等 价 关 系 是 现实 世界 中 广泛 存在 的 一 种 关系 。 对 于 集合 S 中 的 关系 R, 若 具有 自 反 、 对 
称 和 传递 性 , 则 尺 是 一 个 等 价 关 系 。 由 等 价 关系 尽 可 以 产生 集合 S 的 等 价 类 ,可 以 采用 并 
查 集 高 效 地 求解 等 价 类 问题 。 扫 - 扫 
791 什么 叫 并 查 集 

并 查 集 支持 查找 一 个 元 素 所 属 的 集合 以 及 两 个 元 素 各 自 所 属 的 集合 的 人 
合并 等 运算 。 当 给 出 两 个 元 素 的 一 个 无 序 对 (a.5) 时 ,需要 快速 “合并 ”a 和 视频 讲解 
2 分 别 所 在 的 集合 ,这 期 间 需 要 反复 “查找 ” 某 元 素 所 在 的 集合 。“ 并 ”、“ 查 ” 
和 * 集 ”3 个 字 由 此 而 来 。 在 这 种 数据 类 型 中 ,n 个 不 同 的 元 素 被 分 为 若干 组 。 每 组 是 一 个 




















集合 ,这 种 集合 叫 分 离 集合 , 称 之 为 并 查 集 (disjoint-set) 。 ~ 


下 面 通过 求 亲 不 关系 的 例子 说 明 并 查 集 求解 等 价 问题 的 过 程 。 

问题 : 对 于 亲戚 关系 问题 , 现 给 出 一 些 亲 戚 关系 的 信息 ,如 Marry 和 Tom 是 亲戚 、Tom 
和 Ben 是 亲戚 等 ,需要 从 这 些 信 息 中 推出 Marry 和 Ben 是 否 为 亲戚 。 

输入 : 第 一 部 分 以 NM 开始 。N 为 问题 涉及 的 人 的 个 数 (1 委 N 委 20 000)。 这 些 人 的 
编号 为 1.2.3、…、N。 下 面 有 M 行 (1 三 M1 000 000) ,每 行 有 两 个 数 a;、b; ,表示 已 知 w 和 
0b; 是 亲戚 。 
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第 二 部 分 以 Q 开始。 以 下 Q 行 对 应 Q 个 询问 (1 三 Q<1000 000) ,每 行为 cdi ,表示 询 
问 c 和 4d; 是 否 为 亲戚。 
输出 : 对 于 每 个 询问 c;、d;, 输 出 一 行 ,车 c 和 为 亲 威 , 则 输出 “Yes”, 否 则 输出 “No”。 


输入 样 例 : 

107 //N=10, M=7 

24 // 表 示 2 和 4 是 亲戚 
57 // 表 示 5 和 7 是 亲戚 
18 // 表 示 1 和 3 是 亲 威 
89 // 表 示 8 和 9 是 亲戚 
1 // 表 示 1 和 2 是 亲 威 
56 // 表 示 5 和 6 是 亲 威 
23 // 表 示 2 和 3 是 亲戚 
3 //Q=3 

34 // 问 3 和 4 是 否 为 亲戚 
7 10 // 问 7 和 10 是 否 为 亲戚 
89 // 问 8 和 9 是 否 为 亲戚 


问题 分 析 : 亲 威 关系 是 一 种 典型 的 等 价 关 系 。 将 每 个 人 抽象 成 为 一 个 点 (每 个 点 用 
其 编号 唯一 标识 ) ,输入 数据 给 出 M 个 边 的 关系 , 当 两 个 人 是 亲戚 的 时 候 两 点 间 有 一 条 
边 , 很 自然 地 就 得 到 了 一 个 NN 个 项 点、.M 条 边 的 图 论 模型 ,在 图 的 一 个 连通 块 中 的 任意 点 
之 间 都 是 亲戚 。 对 于 最 后 的 Q 个 提问 , 即 判断 所 提问 的 两 个 顶点 是 否 在 同一 个 连通 
块 中 。 

采用 集合 的 思路 求解 : 对 于 每 个 人 建立 一 个 集合 ,在 开始 的 时 候 集合 元 素 是 这 个 人 本 
身 , 表 示 开 始 时 不 知道 任何 人 是 他 的 亲戚 ,以 后 每 次 给 出 一 个 亲戚 关系 时 就 将 两 个 集合 合 
并 ,这 样 实时 地 得 到 了 在 当前 状态 下 总 的 亲 成 关系 。 如 果 有 提问 , 即 在 当前 得 到 的 结果 中 看 
两 个 元 素 是 否 属于 同一 集合 。 对 于 样 例 数据 的 解释 如 表 7. 6 所 示 。 

表 7.6 对 亲 威 关系 样 例 数据 的 解释 








输入 关系 等 价 类 

初始 状态 {1}{2}{3}{4}{5}{6}{7}{8}{9}{10} 
(2,4) {1}{2,4}{3}{5}{6}{7}{8}{9}{10} 
57 {1}{2,4}{3}{5,7}{6){8}{9}{10} 
(1,3) {1,3}{2,4}{5,7}{6}{8}{9} {10} 
(8,9) {1,3}{2,4}{5,7}{6}{8,9}{10} 
(1,2) {1,2,3,4}{5,7}{6}{8,9}{10} 
(5,6) {1,2,3,4}{5,6,7}{8,9}{10} 
(253) {1,2,3,4}{5,6,7}{8,9}{10} 





由 表 7.6 可 以 看 出 ,操作 是 在 集合 的 基础 上 进行 的 ,没有 必要 保存 所 有 的 边 ,而 且 每 一 
步 得 到 的 划分 方式 是 动态 的 。 

并 查 集 的 数据 结构 记录 了 一 组 分 离 的 动态 集合 S= {Si,S:,…'Se})。 每 个 动态 集合 
Si(1 人 ik) 通 过 一 个 “代表 ”加 以 标识 ,该 代表 即 为 所 代表 的 集合 中 的 某 个 元 素 。 对 于 集合 
Si, 选 取 其 中 哪个 元 素 作为 代表 是 任意 的 。 
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对 于 给 定 的 编号 为 1~n 的 n 个 元 素 ,z 表示 其 中 的 一 个 元 素 , 设 并 查 集 为 S, 并 查 集 的 
实现 需要 支持 如 下 运算 。 

(1) MAKE_SET(S,n): 初始 化 并 查 集 S, 即 S 二 {S51 ,S, ,…,S,) ,每 个 动态 集合 S; (1 所 
i<n) 仅 仅 包 含 一 个 编号 为 i 的 元 素 ,该 元 素 作为 集合 Si 的 “代表 ”。 

(2) FIND_SET(S,z): 返回 并 查 集 S 中 zz 元 素 所 在 集合 的 代表 。 

(3) UNION(S,z,y): 在 并 查 集 S 中 将 x 和 y 两 个 元 素 所 在 的 动态 集合 (例如 S; 和 
S,) 合 并 为 一 个 新 的 集合 S, U S,。 并 且 假 设 在 此 运算 前 这 两 个 动态 集合 是 分 离 的 ,通常 以 
S, 或 者 5, 的 代表 作为 新 集合 的 代表 。 


792 并 查 集 的 算法 实现 


并 查 集 必须 借助 某 种 数据 结构 来 实现 。 数 据 结构 的 选择 是 一 个 重要 的 
环节 ,选择 不 同 的 数据 结构 可 能 会 在 查找 和 合并 的 操作 效率 上 有 很 大 的 差 di 
别 。 并 查 集 的 数据 结构 的 实现 方法 很 多 ,使 用 比较 多 的 有 数组 实现 、 链 表 实 Wi 
现 和 树 实现 。 这 里 主要 介绍 树 实现 方法 。 

用 有 根 树 表示 集合 , 树 中 的 每 个 结 点 包含 集合 的 一 个 元 素 ,每 棵 树 表 示 一 个 集合 。 多 个 
集合 形成 一 个 森林 ,以 每 棵 树 的 树 根 作为 集合 的 代表 , 树 中 每 个 结 点 有 一 个 指向 双亲 结 点 的 
指针 , 根 结 点 的 双亲 结 点 指针 指向 其 自身 。 

注意 : 在 同一 棵 树 中 的 结 点 属于 同一 个 集合 ,虽然 它们 在 树 中 存在 父子 结 点 关系 ,但 并 
不 意味 着 它们 之 间 存 在 从 属 关系 。 树 中 的 指针 起 的 只 是 联系 集合 中 元 素 的 作用 。 

在 并 查 集中 ,每 个 分 离 集合 对 应 的 一 棵 树 称 为 分 离 集合 树 。 整 个 并 查 集 也 就 是 一 个 分 
离 集合 森林 。 图 7. 32 所 示 为 表示 前 面 亲 不 关系 中 的 各 分 离 集合 树 , 其 包含 4 个 集合 , 即 
{1,2,3,4》 15,6,7》、 (8,9} 和 (110} ,分 别 以 4.7.9 和 10 表示 对 应 集合 的 编号 。 


(b) {5, 6. 7 集合 (0) {8. 9 集合 (d) {10} 集 全 
7.32 用 树 表示 集合 


扫 一 扫 

















显然 在 一 棵 高 度 较 低 的 树 中 查找 根 结 点 的 编号 ( 即 该 集合 的 代表 ) 所 花 的 时 间 较 少 , 那 





么 如 何 保证 构造 的 分 离 集合 树 较 低 呢 ? (Im 


如 果 有 两 棵 分 离 集合 树 A 和 B .高 度 分 别 为 ha 和 hs ,车 hs 记 hs ,应 将 B 树 作为 A 树 的 
子 树 ; 否则 ,应 将 A 树 作为 B 树 的 子 树 。 总 之 ,总 是 将 高 度 较 小 的 分 离 集合 树 作 为 子 树 。 
得 到 了 新 的 分 离 集 合 树 C 的 高 度 hc ,如 以 B 树 作 为 A 树 的 子 树 ,hc 二 MAX{ha ,hs 十 1}。 

这 样 合 并 得 到 的 分 离 集 合 树 的 高 度 不 会 超过 logzn, 是 一 个 比较 平衡 的 树 , 对 应 的 查找 
与 合并 的 时 间 复 杂 度 也 就 稳定 在 O(logsn) 了 。 

为 此 给 每 个 结 点 增加 一 个 秩 (rank) 域 , 它 是 一 个 近似 子 树 高 度 的 正 整 数 ,同时 它 也 是 该 
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结 点 高 度 的 一 个 上 界 。 
为 了 方便 ,采用 顺序 方法 存储 森林 ,对 于 前 面 的 求 亲戚 关系 的 例子 ,其 中 结 点 的 类 型 声 


明 如 下 : 
typedef struct node 
{ int data; // 结 点 对 应 人 的 编号 
int rank; // 结 点 对 应 秩 
int parent; // 结 点 对 应 双亲 下 标 
} UFSTree; // 并 查 集 树 的 结 点 类 型 


1T“ 并 查 集 树 的 初始 化 
建立 一 个 存放 并 查 集 树 的 数组 (, 对 于 前 面 的 求 亲戚 关系 的 例子 ,每 个 结 点 对 应 的 人 ， 
结 点 的 data 值 设置 为 该 人 的 编号 ,rank 值 设置 为 0,parent 值 设置 为 自己 。 算 法 如 下 : 


void MAKE_SET(UFSTree t[] ,int n) // 初 始 化 并 查 集 树 
{ inti; 
ED 
{  t 吕 .data 一 i // 数 据 为 该 人 的 编号 
t 加 .rank 一 0; // 秩 初始 化 为 0 
t 口 .parent 一 i // 双 亲 初 始 化 指向 自己 


} 


在 分 离 集合 森林 中 ,每 一 棵 分 离 集合 树 对 应 一 个 集合 。 如 果 要 查找 某 一 元 素 所 属 的 集 
合 , 就 是 要 找 这 个 元 素 对 应 的 结 点 所 在 的 分 离 集合 树 。 

不 妨 以 分 离 集 合 树 的 根 结 点 的 编号 来 标识 这 个 分 离 集合 树 ,这样 查找 一 个 结 点 所 在 的 
分 离 集 合 树 也 就 是 查找 该 结 点 所 在 分 离 集合 树 的 根 结 点 。 

查找 树 的 根 结 点 的 方法 很 简单 ,只 需 任 取 树 中 的 一 个 结 点 (不 妨 取 要 查找 的 那个 结 点 )， 
沿 双 亲 结 点 方向 一 直 往 树 根 走 : 初始 时 , 取 一 个 结 点 , 走 到 它 的 双亲 结 点 ,然后 以 双亲 结 点 
为 基点 , 走 到 双亲 结 点 的 双亲 结 点 ,… ,直至 走 到 一 个 没有 双亲 结 点 的 结 点 为 止 , 这 个 结 点 就 


是 树 的 根 结 点 。 
对 应 的 算法 如 下 : 
int FIND_SET(UFSTree t[] ,int x) // 在 x 所 在 的 子 树 中 查找 集合 编号 
{ f(x!=t[x] .parent) // 双 亲 不 是 自己 





return(FIND_SET(t,t[xj .parent)); ”// 递 归 在 双亲 中 找 x 
else 
return(x); // 双 亲 是 自己 ,返回 x 
} 


对 于 个 人 ,构成 的 分 离 集合 树 的 高 度 最 高 为 logsn, 所 以 本 算法 的 时 间 复 杂 度 为 O(log2n)。 


3 两 个 元 来 各 自 所 属 的 集合 的 合并 


在 进行 合并 的 时 候 , 只 需要 让 具有 较 小 秩 的 根 指向 具有 较 大 秩 的 根 。 如 果 两 根 的 秩 相 
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等 ,只 需要 使 其 中 一 个 根 指向 另 一 个 ,同时 秩 增加 1。 对 应 的 算法 如 下 ; 


void UNION( UFSTree t[] ,int x, int y) // 将 x 和 y 所 在 的 子 树 合并 
{ x=FIND SET(t,x); // 查 找 x 所 在 分 离 集 合 树 的 编号 
y=FIND_SET(t, y); // 查 找 y 所 在 分 离 集合 树 的 编号 
if (t[x] .rank> t[y]. rank) //y 结 点 的 秩 小 于 x 结 点 的 秩 
t[y] .parent=x; // 将 y 连 到 x 结 点 上 ,x 作为 y 的 双亲 结 点 
else //y 结 点 的 秩 大 于 等 于 x 结 点 的 秩 
{ tLx].parent=y; // 将 x 连 到 y 结 点 上 ,y 作为 x 的 双亲 结 点 
if (t[x] .rank==t[y] .rank) //x 和 y 结 点 的 秩 相同 
t[y] .rank 十 十 ; //y 结 点 的 秩 增 1 


} 


对 于 nn 个 人 ,本 算法 的 时 间 复 杂 度 为 O(logzn)。 
二 本 章 小 结 一 < 一 


本 童 的 基本 学 习 要 点 如 下 : 

(1) 掌握 树 的 相关 概念 ,包括 树 、 结 点 的 度 、 树 的 度 、 分 支 结 点 、 叶 子 结 
点 ,孩子 结 点 、 双 亲 结 点 、 子 孙 结 点 ,祖先 结 点 、 结 点 层次 、 树 的 高 度 和 森林 等 
定义 。 

(2) 掌握 树 的 表示 ,包括 树 形 表示 法 、 文 氏 图 表示 法 、 凹 入 表示 法 和 括 

















号 表示 法 等 
(3) 掌握 树 的 性 质 、 树 的 遍历 方法 。 
(4) 掌握 树 的 3 种 存储 结构 。 
(5) 掌握 二 叉 树 的 概念 ,包括 二 叉 树 、 满 二 叉 树 和 完全 二 叉 树 的 定义 。 














握 二 又 树 的 性 质 。 

握 树 /森林 和 二 叉 树 的 转换 与 还 原 。 
点 掌握 二 叉 树 的 存储 结构 ,包括 二 叉 树 顺序 存储 结构 和 二 叉 链 存储 结构 
握 二 又 树 的 基本 运算 实现 。 

点 掌握 二 又 树 的 各 种 遍历 算法 及 其 应 用 。 

(11) 掌握 二 叉 树 的 构造 方法 。 

(12) 掌握 线索 二 叉 树 的 概念 和 相关 算法 的 实现 。 

(13) 掌握 哈 夫 曼 树 的 定义 、 哈 夫 曼 树 的 构造 过 程 和 哈 夫 曼 编 码 产生 的 方法 。 
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(14) 掌握 并 查 集 的 相关 概念 和 算法 。 aa 





(15) 灵活 运用 二 叉 树 这 种 数据 结构 解决 一 些 综合 应 用 问题 。 











一 人 练习 题 7 一 一 ~ 


1. 有 一 棵 树 的 括号 表示 为 A(B,CCE,F(G)),D) ,回答 下 面 的 问题 : 
(1) 指出 树 的 根 结 点 。 
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(2) 指出 这 棵 树 的 所 有 叶子 结 点 。 

(3) 结 点 C 的 度 是 多 少 ? 

(4) 这 棵 树 的 度 为 多 少 ? 

(5) 这 棵 树 的 高 度 是 多 少 ? 

(6) 结 点 C 的 孩子 结 点 是 哪些 ? 

(7) 结 点 C 的 双亲 结 点 是 谁 ? 

2. 若 一 棵 度 为 4 的 树 中 度 为 2.3、4 的 结 点 个 数 分 别 为 3、2、2, 则 该 树 的 叶子 结 点 的 个 
数 是 多 少 ? 

3. 为 了 实现 以 下 各 种 功能 ,z 结 点 表示 该 结 点 的 位 置 ,给 出 树 的 最 适合 的 存储 结构 : 

(1) 求 z 和 y 结 点 的 最 近 祖 先 结 点 。 

(2) 求 x 结 点 的 所 有 子孙 结 点 。 

(3) 求 根 结 点 到 z 结 点 的 路 径 。 

(4) 求 工 结 点 的 所 有 右边 兄弟 结 点 。 

(5) 判断 zz 结 点 是 否 为 叶子 结 点 。 

(6) 求 工 结 点 的 所 有 和 孩子 结 点 。 

4. 设 二 叉 树 bt 的 一 种 存储 结构 如 表 7. 7 所 示 。 其 中 ,bt 为 树 根 结 点 指针 ,lchild、 
rchild 分 别 为 结 点 的 左 、 右 孩子 指针 域 , 在 这 里 使 用 结 点 编号 作为 指针 域 值 ,0 表示 指针 域 值 
为 空 ; data 为 结 点 的 数据 域 。 请 完成 下 列 各 题 : 

(1) 画 出 二 叉 树 bt 的 树 形 表示 。 

(2) 写 出 按 先 序 、 中 序 和 后 序 遍 历 二 叉 树 bt 所 得 到 的 结 点 序列 。 

(3) 夯 出 二 叉 树 bt 的 后 序 线索 树 ( 不 带头 结 点 ) 。 

表 7.7 二 叉 树 bt 的 一 种 存储 结构 











下 2 3 4 5 6 7 8 9 10 
lchild 0 0 2 3 7 5 8 0 10 1 
data j h d b a c e g i 
rchild 0 0 0 9 4 0 0 0 0 0 






































5. 含有 60 个 叶子 结 点 的 二 叉 树 的 最 小 高 度 是 多 少 ? 

6. 已 知 一 棵 完全 二 又 树 的 第 6 层 ( 设 根 结 点 为 第 1 层 ) 有 8 个 叶子 结 点 , 则 该 完全 二 又 
树 的 结 点 个 数 最 多 是 多 少 ? 最 少 是 多 少 ? 

7. 已 知 一 棵 满 二 又 树 的 结 点 个 数 为 20 一 40 ,此 二 又 树 的 叶子 结 点 有 多 少 个 ? 

8. 已 知 一 棵 二 叉 树 的 中 序 序列 为 cbedahgijf、 后 序 序列 为 cedbhjigfa, 给 出 该 二 又 树 的 
树 形 表示 。 

9. 给 定 5 个 字符 a~f, 它 们 的 权 值 集合 WW 二 {2,3,4,7,8,9}), 试 构造 关于 W 的 一 棵 哈 
夫 曼 树 , 求 其 带 权 路 径 长 度 WPL 和 各 个 字符 的 哈 夫 曼 树 编码 。 

10. 假设 二 又 树 中 每 个 结 点 的 值 为 单个 字符 ,设计 一 个 算法 ,将 一 棵 以 二 又 链 方式 存储 
的 二 又 树 5 转换 成 对 应 的 顺序 存储 结构 a 。 

11. 假设 二 叉 树 中 的 每 个 结 点 值 为 单个 字符 ,采用 顺序 存储 结构 存储 。 设 计 一 个 算法 ， 
求 二 又 树 上 中 的 叶子 结 点 个 数 。 
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12. 假设 二 又 树 中 的 每 个 结 点 值 为 单个 字符 ,采用 二 又 链 存储 结构 存储 。 设 计 一 个 算 
法 ,计算 一 棵 给 定 二 又 树 b 中 的 所 有 单 分 支 结 点 个 数 。 

13. 假设 二 又 树 中 的 每 个 结 点 值 为 单个 字符 ,采用 二 又 链 存储 结构 存储 。 设 计 一 个 算 
法 , 求 二 又 树 5 中 最 小 值 的 结 点 值 。 

14. 假设 二 又 树 中 的 每 个 结 点 值 为 单个 字符 ,采用 二 又 链 存储 结构 存储 。 设 计 一 个 算 
法 ,将 二 又 链 1 复制 到 二 又 链 52 中 。 

15. 假设 二 又 树 中 的 每 个 结 点 值 为 单个 字符 ,采用 二 叉 链 存储 结构 存储 。 设 计 一 个 算 
法 , 求 二 叉 树 5 中 第 层 上 的 叶子 结 点 个 数 。 

16. 假设 二 叉 树 中 的 每 个 结 点 值 为 单个 字符 ,采用 二 叉 链 存储 结构 存储 。 设 计 一 个 算 
法 ,判断 值 为 x 的 结 点 与 值 为 y 的 结 点 是 否 互 为 兄弟 ,假设 这 样 的 结 点 值 是 唯一 的 。 

17. 假设 二 叉 树 中 的 每 个 结 点 值 为 单个 字符 ,采用 二 又 链 存储 结构 存储 。 设 计 一 个 算 
法 ,采用 先 序 遍 历 方法 求 二 叉 树 b 中 值 为 x 的 结 点 的 子孙 结 点 ,假设 值 为 zx 的 结 点 是 唯 
一 的 。 

18. 假设 二 叉 树 采用 二 叉 链 存储 结构 ,设计 一 个 算法 把 二 叉 树 5 的 左 、 右 子 树 进行 交 
换 , 要 求 不 破坏 原 二 叉 树 ,并 用 相关 数据 进行 测试 。 

19. 假设 二 又 树 采用 二 又 链 存储 结构 ,设计 一 个 算法 判断 一 棵 二 又 树 5 的 左右 子 树 是 
否 同 构 。 

20. 假设 二 又 树 以 二 叉 链 存储 ,设计 一 个 算法 判断 一 棵 二 叉 树 5b 是 否 为 完全 二 叉 树 。 


一 >- 上 机 实验 题 7 一 和 


他 验证 性 实验 

实验 题 1: 实现 二 叉 树 的 各 种 基本 运算 的 算法 

目的 : 领会 二 又 链 存储 结构 和 掌握 二 又 树 中 的 各 种 基本 运算 算法 设计 。 

内 容 : 编写 一 个 程序 btree. cpp, 实 现 二 叉 树 的 基本 运算 ,并 在 此 基础 上 设计 一 个 程序 
exp7-1. cpp 完成 以 下 功能 。 

(1) 由 图 7. 33 所 示 的 二 叉 树 创建 对 应 的 二 叉 链 存储 结构 0, 该 二 又 树 的 括号 表示 串 为 
“A(B(D,E(CHGJ,K(IL,MC,N))))),C(F,G(,D))”。 

(2) 输出 二 叉 树 5。 

(3) 输出 归 ' 结 点 的 左 、 右 孩子 结 点 值 。 

(4) 输出 二 叉 树 5 的 高 度 。 

(5) 释放 二 叉 树 5。 


实验 题 2: 实现 二 叉 树 的 各 种 遍历 算法 





设计 。 

内 容 : 编写 一 个 程序 exp7-2. cpp, 实 现 二 叉 树 的 先 序 
遍历 ,中 序 遍历 和 后 序 遍 历 的 递归 和 非 递 归 算 法 ,以 及 层次 
遍历 的 算法 ,并 对 图 7. 33 所 示 的 二 又 树 5b 给 出 求解 结果 。 图 7.33 一 棵 二 叉 树 
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实验 题 3: 由 遍历 序列 构造 二 叉 树 

目的 : 领会 二 叉 树 的 构造 过 程 以 及 构造 二 又 树 的 算法 设计 。 

内 容 : 编写 一 个 程序 exp7-3. cpp, 实 现 由 先 序 序列 和 中 序 序列 以 及 由 中 序 序列 和 后 序 
序列 构造 一 棵 二 叉 树 的 功能 (二 又 树 中 的 每 个 结 点 值 为 单个 字符 ) ,要 求 以 括号 表示 和 四 入 
表示 法 输出 该 二 叉 树 ,并 用 先 序 遍 历 序 列 *ABDEHJKLMNCFGI” 和 中 序 遍 历 序列 
“DBJHLKMNEAFCGI” 以 及 由 中 序 遍 历 序 列 “DBJHLKMNEAFCGI” 和 后 序 遍 历 序列 
“DJLNMKHEBFIGCA” 进 行 验证 。 


实验 题 4: 实现 中 序 线索 化 二 叉 树 

目的 : 领会 线索 二 又 树 的 构造 过 程 以 及 构造 线索 二 又 树 的 算法 设计 。 

内 容 : 编写 一 个 程序 exp7-4. cpp, 实 现 二 叉 树 的 中 序 线索 化 ,采用 递归 和 非 递归 两 种 方 
式 输出 中 序 线索 二 叉 树 的 中 序 序列 ,并 以 图 7. 33 所 示 的 二 叉 树 5 对 程序 进行 验证 。 

实验 题 5; 构造 哈 夫 曼 树 和 生成 哈 夫 曼 编 码 

目的 : 领会 哈 夫 曼 树 的 构造 过 程 以 及 哈 夫 曼 编码 的 生成 过 程 。 

内 容 : 编写 一 个 程序 exp7-5. cpp, 构 造 一 棵 哈 夫 曼 树 ,输出 对 应 的 哈 夫 曼 编码 和 平均 查 
找 长 度 , 并 对 表 7. 8 所 示 的 数据 进行 验证 。 

表 7.8 单词 及 出 现 的 频 度 


单词 The | of |a|to| and in | that | he is | at|on| for | His | are | be 
出 现 频 度 | 1192 | 677 |541|518| 462 | 450 | 242 | 195 | 190 |181|174| 157 | 138 | 124 | 123 





戎 设计 性 实验 

实验 题 6: 求 二 叉 树 中 的 结 点 个 数 、 叶 子 结 点 个 数 、 某 结 点 层次 和 二 叉 树 宽度 

目的 : 掌握 二 叉 树 遍 历 算法 的 应 用 ,熟练 使 用 先 序 . 中 序 、 后 序 3 种 递归 遍历 算法 和 层 
次 遍历 算法 进行 二 又 树 问 题 的 求解 。 

内 容 : 编写 一 个 程序 exp7-6. cpp 实现 以 下 功能 ,并 对 图 7. 33 所 示 的 二 叉 树 进行 验证 。 

(1) 输出 二 叉 树 5 的 结 点 个 数 。 

(2) 输出 二 叉 树 5 的 叶子 结 点 个 数 。 

(3) 求 二 叉 树 5 中 指定 结 点 值 (假设 所 有 结 点 值 不 同 ) 的 结 点 的 层次 。 

(4) 利用 层次 遍历 求 二 又 树 5 的 宽度 。 


实验 题 7: 求 二 叉 树 中 从 根 结 点 到 叶子 结 点 的 路 径 

目的 : 掌握 二 又 树 遍历 算法 的 应 用 ,熟练 使 用 先 序 、 中 序 、 后 序 3 种 递归 和 非 递归 遍历 
算法 以 及 层次 遍历 算法 进行 二 又 树 问题 的 求解 。 

内 容 : 编写 一 个 程序 exp7-7. cpp 实现 以 下 功能 ,并 对 图 7. 33 所 示 的 二 叉 树 进行 验证 。 

(1) 采用 先 序 遍 历 方法 输出 所 有 从 叶子 结 点 到 根 结 点 的 逆 路 径 。 

(2) 采用 先 序 遍 历 方法 输出 第 一 条 最 长 的 逆 路 径 。 

(3) 采用 后 序 非 递归 遍历 方法 输出 所 有 从 叶子 结 点 到 根 结 点 的 逆 路 径 。 

(4) 采用 层次 遍历 方法 输出 所 有 从 叶子 结 点 到 根 结 点 的 逆 路 径 。 


实验 题 8: 简单 算术 表达 式 二 叉 树 的 构建 和 求 值 
目的 : 掌握 二 又 树 遍历 算法 的 应 用 ,熟练 使 用 先 序 、 中 序 、 后 序 3 种 递归 遍历 算法 进行 
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二 又 树 问 题 的 求解 。 

内 容 。 编写 一 个 程序 exp7-8. cpp, 先 用 二 叉 树 来 表示 一 个 简单 算术 表达 式 , 树 的 每 一 个 
结 点 包括 一 个 运算 符 或 运算 数 。 在 简单 算术 表达 式 中 只 包含 十 ,一 、* 、/ 和 一 位 正 整数 且 格 
式 正确 (不 包含 括号 ) ,并 且 要 按照 先 乘除 后 加 减 的 原则 构造 二 又 树 , 图 7. 34 所 示 为 “1 十 2 * 
3 一 4/5” 代 数 表达 式 对 应 的 二 叉 树 ,然后 由 对 应 的 二 丸 树 计算 该 表达 式 的 值 。 
@ 绪 合 性 实验 Q 
实验 题 9: 用 二 叉 树 表示 家 谱 关 系 并 实现 各 种 查找 
功能 @ @@ 

目的 : 掌握 二 又 树 遍历 算法 的 应 用 , 热 练 使 用 先 序 . 中 国人 图 回 
序 .后 序 3 种 递归 遍历 算法 进行 二 叉 树 问题 的 求解 。 @) 二 

内 容 : 编写 一 个 程序 exp7-9. cpp, 采 用 一 棵 二 叉 树 表示 而 元 5 二 沟 册 天水 光 训 当 未 
一 个 家 谱 关 系 (由 若干 家 谱 记 录 构成 ,每 个 家 谱 记 录 由 父 。 “六 
亲 、 妻 子 和 儿子 的 姓名 构成 ,其 中 姓名 是 关键 字 ) ,要 求 程序 
具有 以 下 功能 。 

(1) 文件 操作 功能 : 家 谱 记录 的 输入 ,家 谱 记录 的 输出 ,清除 全 部 文件 记录 和 将 家 谱 记 
录 存 盘 。 要 求 在 输入 家 谱 记录 时 按 从 祖先 到 子孙 的 顺序 输入 ,第 一 个 家 谱 记录 的 父亲 域 为 
所 有 人 的 祖先 。 

(2) 家 谱 操 作 功能 , 用 括号 表示 法 输出 家 谱 二 叉 树 ,查找 某 人 的 所 有 儿子 ,查找 某 人 的 
所 有 祖先 (这 里 的 祖先 是 指 所 设计 的 二 叉 树 结构 中 某 结 点 的 所 有 祖先 结 点 )。 

实验 题 10: 大 学 的 数据 统计 

目的 : 掌握 树 的 存储 结构 ,熟练 使 用 树 遍历 算法 进行 问题 的 求解 。 

内 容 : 编写 一 个 程序 exp7-10. cpp 实现 大 学 的 数据 统计 。 某 大 学 的 组 织 结构 如 表 7. 9 
所 示 ,该 数据 存放 在 文本 文件 abe. txt 中 。 要 求 采用 树 的 孩子 链 存储 结构 存储 它 ,并 完成 以 
下 功能 ， 

表 7.9 某 大 学 的 组 织 结构 
单 位 下 级 单位 (人 数 ) 单 位 下 级 单位 (人 数 ) 








中 华 大 学 计算 机 学 院 物 联网 物 联 班 
中 华 大 学 电信 学 院 物 联 班 38 

计算 机 学 院 计算 机 科学 电信 学 院 电子 信息 类 
计算 机 学 院 信息 安全 电信 学 院 信息 工程 
计算 机 学 院 物 联网 电子 信息 类 电信 1 班 
计算 机 科学 计 科 1 班 电子 信息 类 电信 2 班 
计算 机 科学 计 科 2 班 电子 信息 类 电信 3 班 
计算 机 科学 计 科 3 班 电信 1 班 40 

计 科 1 班 32 电信 2 班 38 

计 科 2 班 35 电信 3 班 42 

计 科 3 班 33 信息 工程 信息 1 班 
信息 安全 信安 1 班 信息 工程 信息 2 班 
信息 安全 信安 2 班 信息 1 班 38 

信安 1 班 36 信息 2 班 35 

信安 2 班 38 
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(1) 从 abc. txt 文件 读数 据 到 尺 数组 中 。 
(2) 由 数组 R 创建 树 : 的 孩子 链 存储 结构 。 
(3) 采用 括号 表示 输出 树 1。 

(4) 求 计算 机 学 院 的 专业 数 。 

(5) 求 计算 机 学 院 的 班 数 。 

(6) 求 电信 学 院 的 学 生 数 。 

(7) 销毁 树 。 


实验 题 11: 二 叉 树 的 序列 化 和 反 序 列 化 

目的 : 深入 掌握 二 又 树 的 遍历 和 构造 算法 。 

内 容 : 编写 一 个 程序 exp7-11. cpp 实现 二 叉 树 的 序列 化 和 反 序 列 化 。 

这 里 介绍 通过 先 序 遍历 实现 二 又 树 的 序列 化 和 反 序 列 化 (也 可 以 采用 层次 遍历 实现 序 
列 化 和 反 序 列 化 ) ,假设 二 又 树 的 每 个 结 点 值 为 单个 字符 (不 含 '# ', 这 里 用 '# 字符 表示 对 应 
空 结 点 )。 所 谓 序列 化 就 是 对 二 又 树 进行 先 序 遍 历 产 生 一 个 字符 序列 的 过 程 ,与 一 般 先 序 遍 
历 不 同 的 是 ,这 里 还 要 记录 空 结 点 。 

例如 ,对 于 如 图 7. 35 所 示 的 一 棵 二 又 树 ,一 般 的 先 序 遍 历 序列 是 “ABDEGCFHI” ,而 这 
里 的 先 序 序列 化 的 结果 是 “ABD# # 正 #G# #C#FH# #I# 井 ” 相 当 于 在 二 又 树 中 标记 
上 所 有 的 空 结 点 ,如 图 7. 36 所 示 ( 也 称 为 扩展 二 叉 树 ) ,然后 进行 先 序 遍 历 。 











人 
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图 7.35 一 棵 二 叉 树 图 7.36 加 上 空 结 点 的 二 叉 树 


所 谓 反 序列 化 就 是 通过 先 序 序列 化 的 结果 串 str 构建 对 应 的 二 叉 树 ,其 过 程 是 用 i 从 头 
到 尾 扫描 str, 采 用 先 序 方法 , 当 i 超 界 时 返回 NULL; 否则 当 遇 到 '# 字符 时 返回 NULL， 
当 遇 到 其 他 字符 时 创建 一 个 结 点 ,然后 递归 构造 它 的 左 、 右 子 树 。 可 以 证 明 , 采 用 先 序 遍历 
实现 的 二 叉 树 序列 化 和 反 序列 化 的 结果 是 唯一 的 。 

实现 上 述 过 程 ,完成 以 下 功能 : 

(1) 创建 二 叉 链 5。 

(2) 采用 括号 表示 输出 二 又 链 0。 

(3) 对 二 叉 链 0 进行 先 序 遍 历 ,产生 先 序 序列 化 序列 str。 

(4) 输出 先 序 序列 化 序列 str。 

(5) 由 str 构建 二 叉 链 51( 反 序列 化 ) 。 

(6) 采用 括号 表示 输出 二 又 链 51。 

(7) 销毁 二 叉 链 5 和 01。 





@00,4 FE 





对 于 串 的 操作 可 以 使 用 第 4 章 设计 的 串 基 本 运算 算法 。 


实验 题 12: 判断 二 叉 树 bl 中 是 否 有 与 b2 相同 的 子 树 

目的 : 深入 掌握 二 又 树 的 遍历 算法 。 

内 容 : 编写 一 个 程序 exp7-12. cpp 判断 二 叉 树 51 中 是 否 有 与 22 相同 的 子 树 ,要 求 算法 
尽 可 能 高 效 。 

实验 题 13: 判断 二 叉 树 bl 中 是 否 有 与 b2 树 形 结构 相同 的 子 树 

目的 : 深入 掌握 二 又 树 的 遍历 算法 。 


内 容 : 编写 一 个 程序 exp7-13. cpp 判断 二 叉 树 51 中 是 否 有 与 52 树 形 结构 相同 的 子 树 ， 
要 求 算 法 尽 可 能 高 效 。 
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图 形 结构 属于 复杂 的 非 线 性 数据 结构 , 在 实际 应 用 中 很 多 问题 
可 以 用 图 来 描述 。 在 图 形 结构 中 , 每 个 元 素 可 以 有 和 零 个 或 多 个 前 驱 
元 素 , 也 可 以 有 零 个 或 多 个 后 继 元 素 , 也 就 是 说 元 素 之 间 的 关系 是 
多 对 多 的 。 

本 章 介绍 图 的 基本 概念 ` 图 的 存储 结构 、 图 的 遍历 和 相关 应 用 
算法 的 实现 等 内 容 。 


O00 ,Mr mm 


图 的 基本 概念 米 


811 图 的 定义 


无 论 多 么 复杂 的 图 都 是 由 顶点 和 边 构 成 的 。 采 用 形式 化 的 定义 ,图 (graph)G 由 两 个 集 
合 V(vertex) 和 E(edge) 组 成 , 记 为 G=(V,E) ,其 中 V 是 顶点 的 有 限 集 合 , 记 为 V(G),E 是 
连接 V 中 两 个 不 同 顶 点 (顶点 对 ) 的 边 的 有 限 集合 , 记 为 E(G)。 

可 以 用 字母 或 自然 数 来 标识 图 中 的 顶点 ,这 里 约定 用 i(0 壹 in 一 1) 表 示 第 i 个 顶点 的 
编号 ,其 中 骆 为 图 中 顶点 的 个 数 。 当 E(G) 为 空 集 时 , 则 图 G 只 有 顶点 ,没有 边 。 

在 图 G 中 ,如 果 表 示 边 的 顶点 对 (或 序 偶 ) 是 有 序 的 , 则 称 G 为 有 向 图 (digraph)。 在 有 
向 图 中 代表 边 的 顶点 对 用 尖 括 号 括 起 来 ,用 于 表示 一 条 有 向 边 ,如 <i,j > 表示 从 顶点 i 到 顶 
点 j 的 一 条 边 ,可 见 <i,j > 和 <j ,i> 是 两 条 不 同 的 边 。 

如 果 在 图 G 中 ,车 <i,j>EE(G) 必 有 <j,i>EE(G), 即 E(G) 是 对 称 的 , 则 用 (i,j) 代 替 
这 两 个 顶点 对 ,表示 顶点 i 与 顶点 7 的 一 条 无 向 边 , 则 称 G 为 无 向 图 (undirgraph)。 显 然 在 
无 向 图 中 Gi, 站 和 (j, 店 所 代表 的 是 同一 条 边 。 所 以 ,无 向 图 可 以 看 成 是 有 向 图 的 特例 。 

图 8. 1(a) 所 示 为 一 个 无 向 图 G1 ,其 顶点 集合 V(G1) 二 {10,1,2,3,4), 边 集合 E(Gi)= 
(C2 (La (L020 (0A) 03 yO 

图 8. 1(b) 所 示 为 一 个 有 向 图 G: ,其 顶点 集合 V(G:)= 二 {10,1,2,3,4}, 边 集合 E(G,)= 
人 


CD 
-0D 


(a) 无 向 图 G1 (b) 有 向 图 G6 
图 8.1 无 向 图 G 和 有 向 图 G 























图 的 抽象 数据 类 型 定义 如 下 : 


ADT Graph 
{ ”数据 对 象 : 





D={ ai| 1<i<n,n 宇 0,a; 为 ElemType 类 型 } //ElemType 是 自 定义 类 型 标识 符 有 


数据 关系 : 
R= {<ai,aj > | ai\a; ED,1<i,j<<n, 其 中 每 个 元 素 可 以 有 零 个 或 多 个 前 驱 元 素 ， 
可 以 有 零 个 或 多 个 后 继 元 素 } 
基本 运算 : 
CreateGraph( &g) : 创建 图 ,由 相关 数据 构造 一 个 图 g. 
DestroyGraph( &g) : 销毁 图 ,释放 图 g 占用 的 存储 空间 . 
DispGraph(g): 输出 图 ,显示 图 g 的 顶点 和 边 信 息 . 
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DFS(g,v): 从 顶点 v 出 发 深度 优先 遍历 图 g . 
BFS(g,v): 从 顶点 v 出 发 广度 优先 遍历 图 g. 





812 图 的 基本 术语 2 

有 关 图 的 各 种 基本 术语 如 下 。 

在 一 个 无 向 图 中 ,车 存在 一 条 边 (i,)), 则 称 顶 点 i 和 顶点 j 为 该 边 的 两 于 
个 端点 (endpoint) ,并 称 它们 互 为 邻接 点 (adjacent) , 即 顶 点 i 是 顶点 j 的 一 个 邻接 点 ,顶点 j 
也 是 顶点 i 的 一 个 邻接 点 , 边 (i,7) 和 顶点 i\j 关联 。 关 联 于 相同 两 个 端点 的 两 条 或 者 两 条 
以 上 的 边 称 为 多 重 边 ,在 数据 结构 中 讨论 的 图 都 是 指 没有 多 重 边 的 图 。 

在 一 个 有 向 图 中 ,车 存在 一 条 有 向 边 <i,j >( 也 称 为 弧 ), 则 称 此 边 是 顶点 i 的 一 条 出 
边 , 同 时 也 是 顶点 j 的 一 条 入 边 ,i 为 此 边 的 起 始 端点 (简称 为 起 点 ),j 为 此 边 的 终止 端点 
(简称 终点 ) ,顶点 j 是 顶点 i 的 出 边 邻 接点 ,顶点 i 是 顶点 j 的 入 边 邻 接点 。 

CL 

在 无 向 图 中 ,一 个 顶点 所 关联 的 边 的 数目 称 为 该 项 点 的 度 (degree)。 在 有 向 图 中 ,顶点 的 
度 又 分 为 入 度 和 出 度 ,以 顶点 j 为 终点 的 边 数 目 , 称 为 该 项 点 的 入 度 (indegree)。 以 顶点 i 为 起 
点 的 边 数目 , 称 为 该 顶点 的 出 度 (outdegree)。 一 个 顶点 的 入 度 与 出 度 的 和 为 该 顶点 的 度 。 

若 一 个 图 中 及 个 顶点 和 e 条 边 ,每 个 顶点 的 度 为 di;(0<i<n 一 1), 则 有 : 

















也 就 是 说 ,一 个 图 中 所 有 顶点 的 度 之 和 等 于 边 数 的 两 倍 。 因 为 图 中 的 每 条 边 分 别 作为 两 个 
邻接 点 的 度 各 计 一 次 。 

了 

若 无 向 图 中 的 每 两 个 顶点 之 间 都 存在 着 一 条 边 , 有 向 图 中 的 每 两 个 顶点 之 间 都 存在 
着 方向 相反 的 两 条 边 , 则 称 此 图 为 完全 图 (completed graph) 。 显 然 ,无 向 完全 图 包含 有 
n(n 一 1)/2 条 边 , 有 向 完全 图 包含 有 n(n 一 1) 条 边 。 例 如 ,图 8. 2(a) 所 示 的 图 是 一 个 具有 4 
个 顶点 的 无 向 完全 图 ,共有 6 条 边 。 图 8. 2(b) 所 示 的 图 是 一 个 具有 4 个 顶点 的 有 向 完全 
图 ,共有 12 条 边 。 








(a) 无 向 完全 图 (b) 有 向 完全 图 











8.2 两 个 具有 4 个 顶点 的 完全 图 


PASS 国 





4“ 稠 宅 图 和 稀 下 图 
当 一 个 图 接近 完全 图 时 , 称 为 稠密 图 (dense graph)。 相 反 , 当 一 个 图 含有 较 少 的 边 数 
(如 e 生 zlog:z) 时 , 则 称 为 稀 朴 图 (sparse graph) 。 


设 有 两 个 图 G==(V,E) 和 G ==(V',E'), 若 V 是 V 的 子 集 , 即 VV, 且 E' 是 E 的 子 集 ， 
即 E' EE, 则 称 G' 是 G 的 子 图 (subgraph) 。 

说 明 : 图 G 的 子 图 一 定 是 个 图 ,所 以 并 非 V 的 任何 子 集 V 入 的 任何 子 集 EE' 都 能 构 
成 G 的 子 图 ,因为 这 样 的 (V ,EE') 并 不 一 定 构成 一 个 图 。 

a 

在 一 个 图 G 二 (V,E) 中 ,从 顶点 i 到 顶点 j 的 一 条 路 径 (path) 是 一 个 顶点 序列 (i,， 
iz，…simsj)。 若 此 图 G 是 无 向 图 , 则 边 CG) ,io) is-1oin),(imsj) 属 于 E(G); 若 
此 图 是 有 向 图 , 则 <iyi >,< 计 ;io > <in-iyim >,<insj > 属于 E(G)。 路 径 长 度 (path 
length) 是 指 一 条 路 径 上 经 过 的 边 的 数目 。 若 一 条 路 径 上 除开 始点 和 结束 点 可 以 相同 以 外 ， 
其 余 顶 点 均 不 相同 , 则 称 此 路 径 为 简单 路 径 (simple path) 。 例 如 ,在 图 8. 2(b) 中 (0,2,1) 就 
是 一 条 简单 路 径 , 其 长 度 为 2。 

7 加 只 或 环 

车 一 条 路 径 上 的 开始 点 与 结束 点 为 同一 个 顶点 , 则 此 路 径 被 称 为 回路 或 环 (cycle)。 开 
始点 与 结束 点 相同 的 简单 路 径 被 称 为 简单 回路 或 简单 环 (simple cycle)。 例 如 ,在 图 8.2(b) 
中 (0,2,1,0) 就 是 一 条 简单 回路 ,其 长 度 为 3。 扫 -- 扫 


Re 
在 无 向 图 G 中 , 关 从 顶点 i 到 顶点 j 有 路 径 , 则 称 顶 点 i 和 顶点 j 是 连 | 齐 
通 的 。 若 图 G 中 的 任意 两 个 顶点 都 是 连通 的 , 则 称 G 为 连通 图 (connected 
graph) ,否则 称 为 非 连通 图 。 无 向 图 G 中 的 极 大 连通 子 图 称 为 G 的 连通 分 。 囊 下 
量 (connected component) 。 显 然 , 连 通 图 的 连通 分 量 只 有 一 个 ( 即 本 身 ) ,而 非 连通 图 有 多 
个 连通 分 量 。 
在 有 向 图 G 中 ,车 从 顶点 i 到 顶点 7 有 路 径 , 则 称 从 顶点 i 到 顶点 j 是 连通 的 。 若 图 C 
中 的 任意 两 个 顶点 i 和 j 都 连通 , 即 从 顶点 i 到 顶点 7 和 从 顶点 j 到 顶点 i 都 存在 路 径 , 则 称 图 
G 是 强 连 通 图 (strongly connected graph)。 有 向 图 G 中 的 极 大 强 连 通 子 图 称 为 G 的 强 连通 
分 量 (strongly connected component)。 显 然 , 强 连通 图 只 有 一 个 强 连通 分 量 ( 即 本 身 ), 非 强 




















连通 图 有 多 个 强 连通 分 量 。 aa 


在 一 个 非 强 连通 图 中 找 强 连 通 分 量 的 方法 如 下 : 

(1) 在 图 中 找 有 向 环 。 

(2) 扩展 该 有 向 环 : 如 果 某 个 顶点 到 该 环 中 的 任 一 顶点 有 路 径 , 并 且 该 环 中 的 任 一 顶 
点 到 这 个 顶点 也 有 路 径 , 则 加 入 这 个 顶点 。 

例如 ,图 8.3(a) 所 示 的 是 一 个 非 强 连通 图 ,其 中 顶点 0、.1、2 构成 一 个 有 向 环 ,然后 考察 项 
点 3, 可 以 将 它 加 入 ,而 顶点 4 和 5 不 能 加 入 。 最 后 得 到 3 个 强 连通 分 量 , 如 图 8. 3(b) 所 示 。 
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(a) 一 个 非 强 连 通 图 (b) 3 个 强 连 通 分 量 
8.3 一 个 非 强 连通 图 的 3 个 强 连 通 分 量 


图 中 的 每 一 条 边 都 可 以 附 有 一 个 对 应 的 数值 ,这 种 与 边 相 关 的 数值 称 为 权 。 权 可 以 表 
示 从 一 个 顶点 到 另 一 个 顶点 的 距离 或 花费 的 代价 。 边 上 带 有 权 的 图 称 为 带 权 图 (weighted 
graph) ,也 称 作 网 (net)。 例 如 ,图 8. 4 是 一 个 带 权 有 向 图 Ga 。 

【 例 8. 1〗 (xz 二 2) 个 顶点 的 强 连通 图 至 少 有 多 少 条 边 ? 这 样 的 有 向 图 是 什么 形状 ? 

根据 强 连 通 图 的 定义 可 知 ,图 中 的 任意 两 个 顶点 i 和 j 都 连通 , 即 从 顶点 i 到 顶点 j 
和 从 顶点 j 到 顶点 i 都 存在 路 径 。 这 样 ,每 个 顶点 的 度 di 之 2, 设 图 中 总 的 边 数 为 ,有 : 


e434>i 2 
即 e 三 n。 因 此,n 个 顶点 的 强 连 通 图 至 少 有 n 条 边 。 


而 只 有 n 条 边 的 强 连通 图 是 环形 的 , 即 从 顶点 0 到 1 有 一 条 有 向 边 ,从 顶点 1 到 2 有 一 
条 有 向 边 ,…, 从 顶点 一 1 到 0 有 一 条 有 向 边 ,如 图 8.5 所 示 。 

















图 8.4 一 个 带 权 有 向 图 Gs 图 8.5 具有 个 顶点 .n 条 边 的 强 连通 图 





图 的 存储 结构 和 基本 运算 算法 洲 


图 的 存储 结构 除了 要 存储 图 中 各 个 顶点 本 身 的 信息 以 外 ,同时 还 要 存储 顶点 与 顶点 之 
间 的 所 有 关系 ( 边 的 信息 )。 常 用 的 图 的 存储 结构 有 邻接 矩阵 和 邻接 表 。 本 节 主 要 讨论 图 的 
两 种 存储 结构 和 基本 运算 算法 的 设计 。 


821 邻接 矩阵 存储 方法 


图 的 邻接 矩阵 (adjacency matrix) 是 一 种 采用 邻接 矩阵 数组 表示 顶点 之 间 相 邻 关 系 的 
存储 结构 。 设 G==(V,E) 是 含有 n(n0) 个 顶点 的 图 ,各 顶点 的 编号 为 0~~(n 一 1), 则 G 的 
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邻接 矩阵 数组 4 是 阶 方 阵 ,其 定义 如 下 : 
(1) 如 果 G 是 不 带 权 无 向 图 , 则 : 

















¥ 车 (i,j) € E(G) 
A[iJ[] = 
0 其 他 
(2) 如 果 G 是 不 带 权 有 向 图 , 则 : E 
1 若 <i,j> € E(G) 视频 讲解 
A[i[0] = 
0 其 他 


(3) 如 果 G 是 带 权 无 向 图 , 则 : 
wy 车 i 隆 j 且 (i,j) € E(G), 该 边 的 权 为 ws 
A[Li][j]= 0 t= 
co ”其 他 
(4) 如 果 G 是 带 权 有 向 图 , 则 : 
wy 车 i 关 j 且 <i,j> E€ E(G), 该 边 的 权 为 ws; 
A[i][]= 0 t= 
co 其 他 
例如 ,图 8. 1(a) 所 示 的 无 向 图 G1 对 应 邻接 矩阵 数组 A1 ,图 8. 1(b) 所 示 的 有 向 图 Cs 对 
应 邻接 矩阵 数组 4; ,图 8. 4 中 的 带 权 有 向 图 Gs 对 应 邻接 矩阵 数组 A; ,这 3 个 邻接 矩阵 数组 
如 图 8.6 所 示 。 





01011 和 和 0 8 m 5 om 
10110 00 1 tw mo0 3 om 
4=|01011 42=|00011 43=|momo0om6 
11101 00000 mmo%9 0 om 
10110 10010 ww ww 0 
图 8.6 3 个 邻接 矩阵 数组 
图 的 完整 邻接 矩阵 类 型 的 声明 如 下 : 
# define MAXV < 最 大 顶点 个 数 > 
# define INF 32767 // 定 义 co 
typedef struct 
{ int no; // 顶 点 的 编号 
InfoType info; // 顶 点 的 其 他 信息 
} VertexType; // 顶 点 的 类 型 
typedef struct 
{ intedges[MAXV] [MAXV]; // 邻 接 答 阵 数组 ~ 
int n,e; // 顶 点 数 , 边 数 
VertexType vexs[MAXV] ; // 存 放 顶 点 信息 
} MatGraph; // 完 整 的 图 邻接 和 矩阵 类 型 
邻接 矩阵 的 特点 如 下 : 


(1) 图 的 邻接 矩阵 表示 是 唯一 的 。 
(2) 对 于 含有 个 顶点 的 图 , 当 采 用 邻接 矩阵 存储 时 ,无 论 是 有 向 图 还 是 无 向 图 ,也 无 
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论 边 的 数目 是 多 少 ,其 存储 空间 都 为 OC0z2 ) ,所 以 邻接 矩阵 适合 于 存储 边 的 数目 较 多 的 稠 
密 图 。 

(3) 无 向 图 的 邻接 矩阵 数组 一 定 是 一 个 对 称 和 矩阵 ,因此 可 以 采用 压缩 存储 的 思想 ,在 存 
放 邻 接 和 矩阵 数组 时 只 需 存 放 上 (或 下 ) 三 角 部 分 的 元 素 即 可 。 

(4) 对 于 无 向 图 ,邻接 矩阵 数组 的 第 i 行 或 第 i 列 非 零 元 素 、 非 == 元 素 的 个 数 正 好 是 顶 
点 的 度 。 

(5) 对 于 有 向 图 ,邻接 和 矩阵 数组 的 第 i 行 (或 第 i 列 ) 非 零 元 素 、 非 元素 的 个 数 正好 是 
顶点 i 的 出 度 (或 入 度 )。 

(6) 在 邻接 矩阵 中 ,判断 图 中 两 个 顶点 之 间 是 否 有 边 或 者 求 两 个 顶点 之 间 边 的 权 的 执 
行 时 间 为 O(1) 。 所 以 在 需要 提取 边 权 值 的 算法 中 通常 采用 邻接 矩阵 存储 结构 。 


822 邻接 表 存 储 方法 


图 的 邻接 表 (adjacency list) 是 一 种 顺序 与 链 式 存储 相 结合 的 存储 方法 。 

对 于 含有 个 顶点 的 图 ,每 个 顶点 建立 一 个 单 链表 ,第 i(0<i<<n 一 1) 个 单 链表 中 的 结 
点 表示 关联 于 顶点 i 的 边 (对 有 向 图 是 以 顶点 i 为 起 点 的 边 ), 也 就 是 将 项 点 i 的 所 有 邻接 点 
(对 有 向 图 是 出 边 邻 接点 ) 链 接 起 来 ,其 中 每 个 结 点 表示 一 条 边 的 信息 。 

每 个 单 链表 再 附设 一 个 头 结 点 ,并 将 所 有 头 结 点 构成 一 个 头 结 点 数组 adjlist,adjlist[ 记 
表示 顶点 i 的 单 链表 的 头 结 点 ,这 样 就 可 以 通过 顶点 i 快速 地 找到 对 应 的 单 扫 -- 扫 
链表 。 

在 邻接 表 中 有 两 种 类 型 的 结 点 ,一 种 是 头 结 点 ,其 个 数 恰好 为 图 中 顶点 























































的 个 数 ; 另 一 种 是 边 结 点 ,也 就 是 单 链 表 中 的 结 点 。 对 于 无 向 图 ,这 类 结 点 | 国 各 3 引 束 
的 个 数 等 于 边 数 的 两 倍 ; 对 于 有 向 图 ,这 类 结 点 的 个 数 等 于 边 数 。 视频 讲解 

边 结 点 和 头 结 点 的 结构 如 下 : 

边 结 点 头 结 点 
adjvex | nextarc | weight data firstarc 

其 中 , 边 结 点 由 3 个 域 组 成 ,adjvex 表示 与 顶点 i 邻接 的 顶点 编号 ,nextarc 指向 下 一 个 
边 结 点 ,weight 存储 与 该 边 相关 的 信息 ,如 权 值 等 。 头 结 点 由 两 个 域 组 成 ,data 存储 顶点 i 
的 名 称 或 其 他 信息 ,firstarc 指向 顶点 i 的 单 链表 中 的 首 结 点 。 


例如 ,图 8. 1(a) 所 示 的 无 向 图 G 对 应 的 邻接 表 如 图 8.7(a) 所 示 , 图 8. 1(b) 所 示 的 有 向 图 
Gs 对 应 的 邻接 表 如 图 8.7(b) 所 示 ,图 8.4 中 的 带 权 有 向 图 Gs 对 应 的 邻接 表 如 图 8. 7(c) 所 示 。 
一 般 情况 下 ,对 于 不 带 有 权 的 图 ,邻接 表 中 的 边 结 点 没有 画 出 weight 域 。 

图 的 完整 邻接 表 存 储 类 型 的 声明 如 下 : 


typedef struct ANode 


{ int adjvex; // 该 边 的 邻接 点 编号 

struct ANode * nextarc; // 指 向 下 一 条 边 的 指针 

int weight; // 该 边 的 相关 信息 ,如 权 值 (这 里 用 整 型 表示 ) 
} ArcNode; // 边 结 点 的 类 型 


typedef struct Vnode 
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{ InfoType info; // 顶 点 的 其 他 信息 
ArcNode * firstarc; // 指 向 第 一 个 边 结 点 
} VNode; // 邻 接 表 的 头 结 点 类 型 
typedef struct 
{VNode adjlist[MAXV]; // 邻 接 表 的 头 结 点 数组 
int n,e; // 图 中 的 顶点 数 n 和 边 数 e 
} AdjGraph; // 完 整 的 图 邻接 表 类 型 
data firstarc adjvex nextarc 
a 了 
of [| 二 -1 人 
1 of 二- :| 二 [3[ 人 ^ 
2|w [1 才 寺 3 二 = [41 人 
3|Ww = 0 -| 1 -| 2 =|4| 八 
4| 醒 一 0 一 2 -|3| 作 
(a) 图 G1 的 邻接 表 adjvex weight nextare 
ee 
ofw 一 | 1 二 3 | 和 8| 二 二 3|5|^ 
1 | 而 -| 2 -3 3 
2 天国 -| 3 | 十 4 6 
3|w | 人 9 
4 ~ 0 -| 3 | 和 
(b) 图 G> 的 邻接 表 (c) 图 G3 的 邻接 表 
图 8.7 3 个 邻接 表 


由 于 在 有 向 图 的 邻接 表 中 只 存放 了 以 一 个 顶点 为 起 点 的 边 ,所 以 不 易 找到 指向 该 项 点 
的 边 ,为 此 可 以 设计 有 向 图 的 逆 邻 接 表 。 所 谓 逆 邻 接 表 (inverse adjacency list) ,就 是 在 有 向 图 
的 邻接 表 中 对 每 个 顶点 链接 的 是 指向 该 顶点 的 边 。 例 如 有 向 图 G 中 有 边 < 1,3 >,< 2,3 >， 
<4,3>, 则 以 下 标 3 为 头 结 点 的 单 链 表 包 含 1.2 和 4 的 结 点 。 

例如 ,图 8.1(b) 所 示 的 有 向 图 G。 和 图 8. 4 中 的 带 权 有 向 图 Gs 对 应 的 逆 邻 接 表 分 别 如 
图 8.8(a) 和 (b) 所 示 。 





























































































































ol 4| 信 
1|w 0 | 和 018|A 人 | = 
2 1| 信 二 | 1|3 六 3|9 人 人 
3 of [1 [21 {41 人 ofs 
4|w 变 外 大 ”|2|6 
(a) 图 G; 的 逆 邻 接 表 (b) 图 G3 的 逆 邻 接 表 














图 8.8 两 个 逆 邻 接 表 
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邻接 表 的 特点 如 下 : 

(1) 邻接 表 的 表示 不 唯一 ,这 是 因为 在 每 个 顶点 对 应 的 单 链表 中 各 边 结 点 的 链接 次 序 
可 以 是 任意 的 ,取决 于 建立 邻接 表 的 算法 以 及 边 的 输入 次 序 。 

(2) 对 于 及 n 个 顶点 和 e 条 边 的 无 向 图 ,其 邻接 表 有 个 头 结 点 和 2e 个 边 结 点 ; 对 于 
及 n 个 顶点 和 e 条 边 的 有 向 图 ,其 邻接 表 有 个 头 结 点 和 e 个 边 结 点 。 显 然 , 对 于 边 数 目 较 
少 的 稀 朴 图 ,邻接 表 比 邻接 矩阵 更 节省 存储 空间 。 

(3) 对 于 无 向 图 ,邻接 表 中 顶点 i 对 应 的 第 i 个 单 链表 的 边 结 点 数目 正好 是 顶点 i 
的 度 。 

(4) 对 于 有 向 图 ,邻接 表 中 顶点 i 对 应 的 第 i 个 单 链表 的 边 结 点 数目 仅仅 是 顶点 i 的 出 
度 。 顶 点 i 的 入 度 为 邻接 表 中 所 有 adjvex 域 值 为 i 的 边 结 点 数目 。 

(5) 在 邻接 表 中 ,查找 顶点 i 关联 的 所 有 边 是 非常 快速 的 ,所 以 在 需要 提取 某 个 顶点 的 
所 有 邻接 点 的 算法 中 通常 采用 邻接 表 存储 结构 。 
823 图 基本 运算 算法 设计 

这 里 介绍 创建 图 .输出 图 和 销毁 图 的 基本 运算 算法 设计 。 对 于 邻接 和 矩 9 
阵 实现 相关 算法 是 十 分 容易 的 ,下 面 讨 论 邻 接 表 的 相关 算法 设计 。 视频 讲解 

根据 邻接 矩阵 数组 A、 顶 点 个 数 n 和 边 数 e 来 建立 图 的 邻接 表 G( 采 用 邻接 表 指 针 方 
式 )。 首 先 为 邻接 表 分 配 G 的 存储 空间 ,并 将 所 有 头 结 点 的 firstarc 指针 设置 为 空 。 扫 描 数 
组 A 查找 不 为 0、 不 为 2 的 元 素 , 若 找到 这 样 的 元 素 A[ 引 [jj], 创 建 一 个 adjvex 域 为 j、 
weight 域 为 A[ 站 [站 的 边 结 点 ,采用 头 持 法 将 它 插入 到 第 i 个 单 链 表 中 。 算 法 如 下 : 

















void CreateAdj(AdjGraph * &G,int A[MAXV][MAXV],int n,int e) ”// 创 建 图 的 邻接 表 
{ inti,j;ArcNode *p; 
G=(AdjGraph * )malloc(sizeof(AdjGraph)); 





for (i=0;i<nii 十 十 ) // 给 邻接 表 中 所 有 头 结 点 的 指针 域 置 初 值 
G —> adjlist[i] .firstarc= NULL:; 
for (i=0;i<n;i+ 十 ) // 检 查 邻 接 和 矩阵 中 的 每 个 元 素 
fortien— li>=0==) 
if (A[I0]!=0 && A0D OG]!=INF) // 存 在 一 条 边 
{ p=(ArcNode * )malloc(sizeof(ArcNode)); // 创 建 一 个 结 点 p 
p—> adjvex=j; // 存 放 邻 接点 
p 一 weight=A[D 0; // 存 放权 
p—> nextarc 一 G 一 > adjlist[] .firstarc; // 采 用 头 插 法 插入 结 点 p 


G —> adjlist[i] .firstarc=p; 
} 
G>nen;G Pemes 


. 


2 给 由 图 的 运算 算 状 
扫描 邻接 表 G 的 头 结 点 数组 adjlist, 对 于 每 个 单 链表 , 先 输出 头 结 点 的 顶点 信息 (这 里 
输出 顶点 编号 ) ,然后 逐一 输出 单 链 表 中 的 所 有 结 点 的 顶点 编号 。 算 法 如 下 : 


ASS 


void DispAdj(AdjGraph * G) // 输 出 邻接 表 G 
{ inti;ArcNode *p; 
for (i=0;i<G 一 nii 十 十 ) 
{ p=G-—>adjlist[].firstarc; 
printf("%3d: ",i); 
while (p!= NULL) 
{ printf("%3d[%d]—",p—> adjvex,p 一 > weight); 
p 王 p 一 > nextarc; 
} 
printf( i \n") 3 


} 
3 销 员 图 的 运算 算 决 


对 于 邻接 表 G, 扫 描 其 头 结 点 数组 adjlist 指向 的 所 有 的 单 链表 ,逐个 释放 单 链表 中 的 边 
结 点 ,最 后 释放 头 结 点 数组 。 算 法 如 下 : 


void DestroyAdj(AdjGraph * &G) // 销 毁 邻 接 表 
{ inti;ArcNode * pre, * p; 
for (i=0;i<G 一 nii 十 十 ) // 扫 描 所 有 的 单 链表 
{ pre=G —> adjlist[i] .firstarc; //Pp 指向 第 i 个 单 链表 的 头 结 点 


if (pre!= NULL) 
{ p=pre—> nextarc; 


while (p!=NULL) // 释 放 第 i 个 单 链表 的 所 有 边 结 点 
{ free(pre); 


pre=p; P=p 一 nextarc; 
} 
free( pre); 
} 
} 


free(G); // 释 放 头 结 点 数组 
} 


说 明 : 将 图 的 两 种 存储 结构 的 声明 代码 存放 在 graph. h 头 文件 中 ,将 图 的 基本 运算 算 
法 代码 存放 在 graph. cpp 文件 中 。 

【 例 8. 2〗 对 于 具有 个 顶点 的 图 G: 

(1) 设计 一 个 将 邻接 矩阵 转换 为 邻接 表 的 算法 ; 

(2) 设计 一 个 将 邻接 表 转 换 为 邻接 矩阵 的 算法 ; 

(3) 分 析 上 述 两 个 算法 的 时 间 复 杂 度 。 

(1) 在 图 G 的 邻接 矩阵 g 中 查找 值 不 为 0、 不 为 = 的 元 素 , 若 找到 这 5 
样 的 元 素 , 例 如 g. edges[i[j], 表 示 存 在 一 条 边 ,创建 一 个 adjvex 域 为 7 的 视频 讲解 
边 结 点 ,采用 头 插 法 将 它 插 入 到 第 i 个 单 链表 中 。 算 法 如 下 : 




















void MatToList(MatGraph g, AdjGraph * &G) // 将 邻接 和 矩阵 g 转换 成 邻接 表 G 


vin 
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ArcNode *p; 

G= (AdjGraph * )malloc(sizeof(AdjGraph)); 

for (i 王 0;i<g.nii 十 十 ) // 将 邻接 表 中 所 有 头 结 点 的 指针 域 置 初 值 
G —> adjlist[i] .firstarc= NULL; 

for (i=0;i<g.n;i+t 十 ) // 检 查 邻 接 和 矩阵 中 的 每 个 元 素 





for (j 王 g.n 一 1;j> 王 0;j 一 一 ) 
if (g.edges[] 0D] !=0& & g.edges[] 0] !=INF) // 存 在 一 条 边 


{ p=(ArcNode * )malloc(sizeof(ArcNode)); // 创 建 一 个 边 结 点 p 
p—>adjvex=j; p 一 > weight=g. edges[] 0] ; 
p> nextarc 一 G -> adjlist[] .firstarc; // 采 用 头 插 法 插 人 结 点 p 


G —> adjlist[i] .firstarc=p; 
} 
G->n=gn;G->e=g-6, 
} 


(2) 初始 时 将 邻接 矩阵 g 中 所 有 边 对 应 的 元 素 值 设 置 为 0, 扫描 邻接 表 G 的 所 有 单 链 
表 , 通 过 第 i 个 单 链表 查找 顶点 i 的 相 邻 结 点 ,将 邻接 矩阵 g 的 元 素 g. edges[i][p 一 > 
adjvexj 修 改 为 该 边 的 权 p 一 > weight。 算 法 如 下 : 


void ListToMat( AdjGraph * G,MatGraph &-g) // 将 邻接 表 G 转换 成 邻接 矩阵 g 
{ intiy 
ArcNode *p; 
for (i=0;i<G 一 nii 十 十 ) // 扫 描 所 有 的 单 链表 
{ p=G—>adjlist[] .firstarc; //p 指向 第 i 个 单 链表 的 头 结 点 
while (p!= NULL) // 扫 描 第 i 个 单 链表 


{ g.edges[i][p—>adjvex]=p—> weight; 
p=p 一 nextarc; 
} 
} 
g:n=G—>n;g.e=G—>e; 
} 


(3) 算法 (1) 中 有 两 重 for 循环 ,其 时 间 复 杂 度 为 O(n*)。 算 法 (2) 中 虽然 有 两 重 循 环 ， 
但 只 对 邻接 表 的 所 有 头 结 点 和 边 结 点 访问 一 次 ,对 于 无 向 图 ,访问 次 数 为 n 十 2e, 对 于 有 向 
图 ,访问 次 数 为 十 e, 所 以 算法 (2) 的 时 间 复 杂 度 为 O(n 十 e) ,其 中 。 为 图 的 边 数 。 


824 其 他 存储 方法 站 


十 字 链 表 (orthogonal list) 是 有 向 图 的 另外 一 种 存储 结构 , 它 是 邻接 表 村 
和 逆 邻 接 表 的 结合 。 下 面 以 图 8. 9(a) 所 示 的 有 向 图 来 说 明 十 字 链 表 的 创 mi 
建 过 程 。 

(1) 图 中 的 每 个 顶点 对 应 一 个 头 结 点 ,结构 为 (data,firstin,firstout) ,其 中 data 表示 该 
顶点 的 信息 ; firstin 表示 入 边 信息 ; firstout 表示 出 边 信息 。 这 里 有 4 个 顶点 ,构造 4 个 头 
结 点 ,编号 为 0 一 3 ,与 顶点 编号 相对 应 ,如 图 8. 9(b) 所 示 。 

(2) 图 中 的 每 条 边 对 应 一 个 边 结 点 ,结构 为 (tailvex,headvex,hlink,tlink,weight) ,其 
中 tailvex 和 headvex 分 别 表示 该 边 的 起 点 和 终点 ; hlink 指向 相同 起 点 的 下 一 个 边 结 点 ; 
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(a) 一 个 有 向 图 (b) 一 个 十 字 链 表 


8.9 一 个 有 向 图 的 十 字 链 表 


tlink 指向 相同 终点 的 下 一 个 边 结 点 ; weight 表示 该 边 的 信息 ,例如 权 ( 这 里 没有 画 出 来 ) 。 
该 图 有 7 条 边 ,构造 7 个 边 结 点 ,首先 标 出 起 点 和 终点 。 

(3) 构造 横向 链接 : 对 于 顶点 0, 以 它 为 起 点 的 边 有 (0,1) 和 (0,2), 让 头 结 点 0 的 
firstout 指向 (0,1) 边 结 点 ,让 (0,1) 边 结 点 的 hlink 指向 (0,2) 边 结 点 ,(0,2) 边 结 点 的 hlink 
置 为 空 。 对 于 其 他 顶点 ,采用 类 似 方法 构建 ,与 邻接 表 的 构造 过 程 类 似 , 如 图 8. 9(b) 中 的 实 

(4) 构造 纵向 链接 : 对 于 顶点 0, 以 它 为 终点 的 边 有 (2,0) 和 (3,0) ,让 头 结 点 0 的 firstin 
指向 (2,0) 边 结 点 ,让 (2,0) 边 结 点 的 tlink 指向 (3,0) 边 结 点 ,(3,0) 边 结 点 的 tlink 置 为 空 。 对 
于 其 他 顶点 ,采用 类 似 方法 构建 ,与 逆 邻 接 表 的 构造 过 程 类 似 ,如 图 8.9(b) 中 的 虚线 箭头 。 

在 图 的 十 字 链 表 表 示 中 , 既 容易 找到 以 顶点 wv 为 起 点 的 所 有 边 ( 方 便 求 其 出 度 ) ,也 容易 
找到 以 顶点 v 为 终点 的 所 有 边 ( 方 便 求 其 入 度 )。 

2 外 接 多 重 家 

邻接 多 重 表 (adjacency multi-list) 是 无 向 图 的 另外 一 种 存储 结构 ,与 十 字 链 表 类 似 。 下 
面 以 图 8. 10(a) 所 示 的 无 向 图 来 说 明 邻 接 多 重 表 的 创建 过 程 。 


data firstarc i ilink j jlink 

























































































(a) 一 个 无 向 图 (b) 一 个 邻接 多 重 表 
图 8.10 一 个 有 无 图 的 邻接 多 重 表 


(1) 图 中 的 每 个 顶点 对 应 一 个 头 结 点 ,结构 为 (data,firstarc) ,其 中 data 表示 该 项 点 的 信 
息 ; firstarc 指向 第 一 条 依附 该 顶点 的 边 。 这 里 有 5 个 顶点 ,构造 5 个 头 结 点 ,编号 为 0 一 4, 与 





PE 


EE GO@ 


顶点 编号 相对 应 。 

(2) 图 中 的 每 条 边 对 应 一 个 边 结 点 ,结构 为 (mark,i,ilink,j ,jlink,weight) ,其 中 mark 
为 标志 域 ,可 用 来 标记 该 边 是 否 被 搜索 过 (这 里 均 为 空 ); i\j 表示 该 边 的 两 个 顶点 ; ilink 指 
向 下 一 条 依附 于 顶点 i 的 边 结 点 ; jlink 指向 下 一 条 依附 于 顶点 j 的 边 结 点 ; weight 表示 该 
边 的 信息 ,例如 权 ( 这 里 没有 画 出 来 )。 该 图 有 6 条 边 ,构造 6 个 边 结 点 ,首先 标 出 依附 的 顶点 ， 
如 图 8.10(b) 所 示 。 注 意 ,由 于 是 无 向 图 , 边 <i,j > 和 <j ,i> 只 构造 一 个 边 结 点 。 

(3) 构造 链接 : 对 于 顶点 0, 依 附 的 有 边 (0,1) 和 (0,3) ,让 头 结 点 0 的 firstarc 指向 (0,1) 边 
结 点 ,让 (0,1) 边 结 点 的 ilink 指向 (0,3) 边 结 点 ,(0,3) 边 结 点 的 ilink 置 为 空 ,在 图 8. 10(b) 中 用 
实 线 箭 头 表示 。 
对 于 顶点 1 ,依附 的 有 边 (0,1)、(2,1) 和 (4,1), 让 头 结 点 1 的 firstarc 指向 (0,1) 边 结 
点 ,让 (0,1) 边 结 点 的 jlink 指向 (2,1) 边 结 点 ,(2,1) 边 结 点 的 jlink 指向 (4,1) 边 结 点 , (4,1) 
边 结 点 的 jlink 置 为 空 , 在 图 8. 10(b) 中 用 实 线 箭头 表示 。 
对 于 顶点 2, 依 附 的 有 边 (2,1)、(2,3) 和 (2,4), 让 头 结 点 2 的 firstarc 指向 (2,1) 边 结 
点 ,让 (2,1) 边 结 点 的 ilink 指向 (2,3) 边 结 点 ,(2,3) 边 结 点 的 ilink 指向 (2,4) 边 结 点 , (2,4) 
边 结 点 的 ilink 置 为 空 。 
对 于 顶点 3, 依 附 的 有 边 (2,3) 和 (0,3), 让 头 结 点 3 的 firstarc 指向 (2,3) 边 结 点 ,让 
(2,3) 边 结 点 的 jlink 指向 (0,3) 边 结 点 ,(0,3) 边 结 点 的 jlink 置 为 空 。 
对 于 顶点 4, 依附 的 有 边 (4,1) 和 (2,4), 让 头 结 点 4 的 firstarc 指向 (4,1) 边 结 点 ,让 
(4,1) 边 结 点 的 ilink 指向 (2,4) 边 结 点 ,(2,4) 边 结 点 的 jlink 置 为 空 。 

在 邻接 多 重 表 中 所 有 依附 于 同一 顶点 的 边 串联 在 同一 个 链表 中 。 与 邻接 表 相 比 ,邻接 
表 中 的 同一 条 边 对 应 两 个 边 结 点 ,而 邻接 多 重 表 中 只 有 一 个 边 结 点 ,它们 的 各 种 基本 操作 是 
相似 的 。 








831 图 的 遍历 的 概念 和 


从 给 定 图 中 任意 指定 的 顶点 ( 称 为 初始 点 ) 出 发 ,按照 某 种 搜索 方法 沿 着 | 
图 的 边 访问 图 中 的 所 有 顶点 ,使 每 个 顶点 仅 被 访问 一 次 ,这 个 过 程 称 为 图 的 遍 [ts j 
历 。 如 果 给 定 图 是 连通 的 无 向 图 或 者 是 强 连通 的 有 向 图 , 则 遍历 过 程 一 次 就 视频 讲解 
能 完成 ,并 可 按 访问 的 先后 顺序 得 到 由 该 图 的 所 有 顶点 组 成 的 一 个 序列 。 

图 的 遍历 比 树 的 遍历 更 复杂 ,因为 从 树 根 到 达 树 中 的 任意 结 点 只 有 一 条 路 径 , 而 从 图 的 
初始 点 到 达 图 中 的 每 个 顶点 可 能 存在 着 多 条 路 径 。 当 沿 着 图 中 的 一 条 路 径 访 问 过 某 一 顶点 
之 后 ,可 能 还 沿 着 另 一 条 路 径 回 到 该 顶点 , 即 存在 回路 。 为 了 避免 同一 个 顶点 被 重复 访问 ， 
大 家 必须 记 住 每 个 被 访问 过 的 顶点 。 为 此 ,可 设置 一 个 访问 标记 数组 visited, 当 顶点 i 被 访 
问 过 时 ,数组 中 的 元 素 visited[ 门 置 为 1 ,否则 置 为 0。 

根据 搜索 方法 的 不 同 ,图 的 遍历 方法 有 两 种 : 一 种 叫 深 度 优先 遍历 (Depth First 
Search,DFS) , 另 一 种 叫 广度 优先 遍历 (Breadth First Search,BFS) 。 
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832 深度 优先 遍历 


深度 优先 遍历 的 过 程 是 从 图 中 的 某 个 初始 点 v 出 发 ,首先 访问 初始 点 v, 然 后 选择 一 个 
与 顶点 v 相 邻 且 没 被 访问 过 的 顶点 包 , 以 包 为 初始 顶点 ,再 从 它 出 发 进行 深度 优先 遍历 , 直 
到 图 中 与 顶点 v 邻接 的 所 有 顶点 都 被 访问 过 为 止 ,显然 这 个 遍历 过 程 是 一 个 递归 过 程 。 

例如 ,对 于 图 8.4 所 示 的 有 向 图 ,从 顶点 0 开始 进行 深度 优先 遍历 ,可 以 得 到 以 下 访问 
序列 :01243,03241。 

以 邻接 表 为 存储 结构 的 深度 优先 遍历 算法 如 下 (其 中 心 是 初始 点 ,visited 是 一 个 全 局 数 
组 ,初始 时 所 有 元 素 均 为 0, 表示 所 有 顶点 尚未 被 访问 过 ) : 


int visited[TMAX] = {0}; // 全 局 数组 
void DFS( AdjGraph * G,int v) // 深 度 优先 遍历 算法 
{ ArcNode *p; 
visited[v] =1; // 置 已 访问 标记 
printf("%d ",v); // 输 出 被 访问 顶点 的 编号 
p=G —> adjlist[v] .firstarc; //p 指向 顶点 的 第 一 个 邻接 点 


while (p!= NULL) 
{ if (visited[p—>adjvex]==0) // 若 p 一 adjvex 顶点 未 被 访问 ,递归 访问 它 
DFS(G, p —> adjvex); 
p=p—> nextarc; //p 指向 顶点 v 的 下 一 个 邻接 点 
} 
} 


以 邻接 矩阵 为 存储 结构 的 深度 优先 遍历 算法 与 此 类 似 , 这 里 不 再 列 出 。 扫 -- 扫 

下 面 以 图 8.7(a) 所 示 的 邻接 表 为 例 调用 DFS 算法 ,假设 初始 点 v 一 2， 
调用 DFS(G,2) 的 执行 过 程 如 下 。 

@ DFS(G,2): 访问 顶点 2, 找 顶点 2 的 相 邻 顶点 1, 它 未 被 访问 过 ， p 
转 @， 视频 讲解 

@ DFS(G,1): 访问 顶点 1, 找 顶点 1 的 相 邻 顶点 0, 它 未 被 访问 过 ， 
转 @; 

@ DFS(G,0): 访问 顶点 0, 找 顶点 0 的 相 邻 顶点 1, 它 已 被 访问 , 找 下 一 个 相 邻 顶点 3， 
它 未 被 访问 过 , 转 @; 

@ DFS(G,3): 访问 顶点 3, 找 顶点 3 的 相 邻 顶点 0、1、2, 它 们 均 已 被 访问 , 找 下 一 个 相 
邻 顶 点 4, 它 未 被 访问 过 , 转 @; 

@ DFS(G,4): 访问 顶点 4, 找 顶点 4 的 相 邻 顶点 ,所 有 相 邻 顶点 均 已 被 访问 ,退出 
DFS(G,4), 转 @; 











继续 DFS(G,3): 顶点 3 的 所 有 后 继 相 邻 顶点 均 已 被 访问 ,退出 DFS(G,3), 转 @; ~ 


@ 继续 DFS(G,0): 顶点 0 的 所 有 后 继 相 邻 顶点 均 已 被 访问 ,退出 DFS(G,0), 转 @; 
@ 继续 DFS(G,1): 顶点 1 的 所 有 后 继 相 邻 顶点 均 已 被 访问 ,退出 DFS(G,1), 转 @; 
继续 DFS(G,2): 顶点 2 的 所 有 后 继 相 邻 顶点 均 已 被 访问 ,退出 DFS(G,1), 转 @; 
@ 结束 。 

如 图 8. 11 所 示 , 从 顶点 2 出 发 的 深度 优先 访问 序列 是 2 1 0 3 4。 

对 于 具有 个 顶点 、e 条 边 的 有 向 图 或 无 向 图 ,DFS 算法 对 图 中 的 每 个 顶点 最 多 调用 一 
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DFS(G, 2) 









访问 项 点 3，DFS(G, 4)， 顶 点 3 的 所 有 邻接 点 均 已 被 访问 --: 





访问 项 点 4， 项 点 4 的 所 有 邻接 点 均 已 被 访问 ---1 
图 8.11 DFS(G,2) 的 执行 过 程 





次 ,因此 其 递归 调用 总 次 数 为 nx。 当 访 问 某 个 顶点 时 ,DFS 的 时 间 主 要 花 在 从 该 项 点 出 发 
查找 它 的 邻接 点 上 。 当 用 邻接 表 表 示 图 时 ,需要 遍历 该 顶点 的 所 有 邻接 点 ,所 以 DFS 的 总 
时 间 为 O(n 十 e); 当 用 邻接 矩阵 表示 图 时 ,需要 遍历 该 顶点 行 的 所 有 元 素 , 所 以 DFS 的 总 时 
间 为 O(n?)。 

从 上 面 可 以 看 出 ,在 深度 优先 遍历 中 ,每 次 沿 着 边 “ 前 进 ”( 纵 向 ) 一 个 顶点 ,相当 于 对 图 
“层次 化 ”, 使 图 中 的 每 个 顶点 都 有 一 个 层次 号 ,只 是 深度 优先 遍历 中 这 个 层次 号 不 如 广度 优 
先 遍 历 中 的 层次 号 有 意义 。 


833 广度 优先 遍历 


广度 优先 遍历 的 过 程 是 首先 访问 初始 点 v, 接 着 访问 项 点 wv 的 所 有 未 被 访问 过 的 邻接 
虚 VisvV2，,"… ,Vs 然后 再 按照 wyu ,wu 的 次 序 访问 每 一 个 顶点 的 所 有 未 被 访问 过 的 邻接 
点 , 依 此 类 推 , 直 到 图 中 所 有 和 初始 点 v 有 路 径 相 通 的 顶点 都 被 访问 过 扫 -- 扫 
为 止 。 

例如 ,对 于 图 8.4 所 示 的 有 向 图 ,从 顶点 0 开始 进行 广度 优先 遍历 ,可 
以 得 到 以 下 访问 序列 : 0 1 3 2 4,0 3 1 2 4。 8 

以 邻接 表 为 存储 结构 ,在 用 广度 优先 遍历 图 时 需要 使 用 一 个 队列 ,这 里 视 大 并 
采用 环形 队列 ,以 类 似 于 二 又 树 的 层次 遍历 方式 来 遍历 图 。 对 应 的 算法 如 
下 (其 中 ,vw 是 初始 点 ): 

















void BFSCAdjGraph * G,int v) 
{ intw,i;ArcNode * pi 





SqQueue * qu; // 定 义 环形 队列 指针 
InitQueue(qu); // 初 始 化 队列 

int visitedLMAXV] ; // 定 义 顶 点 访问 标记 数组 
for (i=0;i<G 一 nii 十 十 ) visited[] =0; // 访 问 标记 数组 初始 化 
printf("%2d", v); // 输 出 被 访问 顶点 的 编号 
visited[v]=1; // 置 已 访问 标记 
enQueue(qu,v); 

while (!QueueEmpty(qu)) // 队 不 空 循环 

{ deQueue(qu, w); // 出 队 一 个 顶点 w 
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p 一 G-> adjlist[w] .firstarc; // 指 向 w 的 第 一 个 邻接 点 
while (p!=NULL) // 查 找 w 的 所 有 邻接 点 
{if (visited[p ->adjvex]==0) // 车 当前 邻接 点 未 被 访问 
{ printf("%2d",p—>adjvex); // 访 问 该 邻接 点 
visited[p 一 adjvex] =1; // 置 已 访问 标记 
enQueue(qu,p —> adjvex); // 该 顶点 进 队 
| 
p=p 一 > nextarc; // 找 下 一 个 邻接 点 
| 
} 
printf("\n"); 


} 


以 邻接 矩阵 为 存储 结构 的 广度 优先 遍历 算法 与 此 类 似 , 这 里 不 再 列 出 。 

下 面 以 图 8.7(a) 所 示 的 邻接 表 为 例 调 用 BFS 算法 ,假设 初始 点 v= 二 2, 调 用 BFS(G,2) 
的 执行 过 程 如 下 。 

@ 访问 顶点 2,2 进 队 , 转 @; 

@ 第 1 次 循环 : 顶点 2 出 队 , 找 其 第 一 个 相 邻 顶点 1, 它 未 被 访问 过 ,访问 之 并 将 1 进 
队 ; 找 顶 点 2 的 下 一 个 相 邻 顶点 3, 它 未 被 访问 过 ,访问 之 并 将 3 进 队 ; 找 顶 点 2 的 下 一 个 
相 邻 顶点 4, 它 未 被 访问 过 ,访问 之 并 将 4 进 队 , 转 @; 

@ 第 2 次 循环 : 顶点 1 出 队 , 找 其 第 一 个 相 邻 顶点 0, 它 未 被 访问 过 ,访问 之 并 将 0 进 
队 ; 找 顶 点 1 的 下 一 个 相 邻 顶点 2, 它 被 访问 过 ; 找 顶 点 1 的 下 一 个 相 邻 顶点 3, 它 被 访问 
过 , 转 @， 

@ 第 3 次 循环 : 顶点 3 出 队 , 依 次 找 其 相 邻 顶点 0.1.2.4, 均 已 被 访问 过 , 转 @， 

加 第 4 次 循环 : 顶点 4 出 队 , 依 次 找 其 相 邻 顶点 0.2、3 , 均 已 被 访问 过 , 转 @; 

第 5 次 循环 : 顶点 0 出 队 , 依 次 找 其 相 邻 顶点 1、3、4, 均 已 被 访问 过 , 转 @; 

@ 此 时 队列 为 空 ,遍历 结束 , 即 21340。 

如 图 8. 12 所 示 , 从 顶点 2 出 发 的 广度 优先 遍历 序列 是 21340。 

对 于 具有 个 顶点 、e 条 边 的 有 向 图 或 无 向 图 ,在 BFS 算法 中 每 个 顶点 都 进 队 一 次 , 因 
此 执行 时 间 与 DFS 相同 。 当 图 采用 邻接 表 表示 图 时 ,BFS 的 总 时 间 为 O(n 十 e); 当 图 采用 
邻接 矩阵 表示 图 时 ,BFS 的 总 时 间 为 O(n?)。 

从 上 面 可 以 看 出 ,在 广度 优先 遍历 中 ,每 次 沿 着 边 * 前 进 ”( 横 向 ) 一 个 顶点 ,也 相当 于 对 
图 “层次 化 ”, 使 图 中 的 每 个 顶点 都 有 一 个 层次 号 ,由 于 在 搜索 中 不 同 路 径 可 能 会 有 多 条 边 到 
达 , 在 广度 优先 遍历 中 取 离 出 发 点 最 短 者 , 即 层次 号 最 低 的 那个 。 也 就 是 说 ,从 顶点 vv 出 发 
进行 广度 优先 遍历 到 顶点 4, 取 wv 到 w 的 一 条 最 短路 径 ( 长 度 为 0) ,如 果 w 的 层次 号 为 !, 则 





顶点 wx 的 层次 号 一 定 为 2! 十 1。 es 


834 非 连通 图 的 遍历 


前 面 讨论 了 图 的 两 种 遍历 方法 ,对 于 无 向 图 来 说 ,若是 连通 图 , 则 一 次 
遍历 能 够 访问 到 图 中 的 所 有 顶点 ; 若 无 向 图 是 非 连通 图 , 则 只 能 访问 到 初 
始点 所 在 连通 分 量 中 的 所 有 顶点 ,其 他 连通 分 量 中 的 顶点 是 不 可 能 访问 到 
的 。 为 此 需要 从 其 他 每 个 连通 分 量 中 选择 初始 点 ,分 别 进 行 遍历 ,这 样 才能 视频 讲解 
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调用 BFS(G.2) 队列 状态 
| (EA 
访问 2，2 进 队 f 
| front rear 
2 出 队 
找 2 的 相 邻 点 1， 访 问 1，1 进 队 LA A 
找 2 的 相 邻 点 3， 访 问 3，3 进 队 11314 
找 2 的 相 邻 点 4， 访 问 4，4 进 队 1 
| front rear 
1 出 队 0 2 3. 45 6 
找 1 的 相 邻 点 0， 访 问 0，0 进 队 3|4|o 
找 1 的 相 邻 点 2( 已 访问 ) 
找 ! 的 相 邻 点 3( 已 访问 ) front rear 
3 出 队 012345 6 
找 3 的 相 邻 点 0( 已 访问 ) 4|0 
找 3 的 相 邻 点 1( 已 访问 ) FT 
找 3 的 相 已 访问 ) front rear 
找 3 的 相 邻 点 4( 已 访问 ) 
0 2 3 4 5 6 
找 4 的 和 | Lo 
找 4 的 村 
找 4 的 相 邻 点 front rear 
5 
找 0 的 相 已 访问 ) 
找 0 的 相 已 访问 ) 
找 0 的 相 邻 点 4( 已 访问 ) front rear 














图 8.12 BFS(G,2) 的 执行 过 程 


够 访问 到 图 中 的 所 有 项 点。 

对 于 有 向 图 来 说 , 若 从 初始 点 到 图 中 的 每 个 顶点 都 有 路 径 , 则 能 够 访问 到 图 中 的 所 有 项 
点 ; 否则 不 能 访问 到 所 有 项 点 ,为 此 同样 需要 再 选择 初始 点 ,继续 进行 遍历 ,直到 图 中 的 所 
有 顶点 都 被 访问 过 为 止 。 

采用 深度 优先 遍历 非 连 通 无 向 图 的 算法 如 下 : 


DFSI1(AdjGraph * G) 
{ "intis 
for (i=0;i<G—>n;i+ 二 ) 
if (visited[] ==0) DFS(G,); 
} 


采用 广度 优先 遍历 非 连 通 无 向 图 的 算法 如 下 : 


ASAS 





BFSICAdjGraph * G) 
0 nt 
for (i=0;i<G—>n;i+t 二 ) 
if (visited[] ==0) BFS(G,); 
} 


【 例 8.3】 假设 图 G 采 用 邻接 表 存 储 .设计 一 个 算法 ,判断 无 向 图 G 是 否 连 通 。 若 连 
通 , 返 回 true, 否 则 返回 false。 

可 采用 某 种 遍历 方式 判断 无 向 图 G 是 否 连通 。 这 里 用 深度 优先 遍历 方法 , 先 给 
visited 数组 (为 全 局 变量 ) 的 所 有 元 素 置 初 值 0, 然 后 从 0 顶点 开始 遍历 该 图 。 在 一 次 遍 
历 之 后 ,车 所 有 顶点 i 的 visited[ 门 均 为 1, 则 该 图 是 连通 的 ,否则 不 连通 。 对 应 的 算法 
如 下 : 


bool Connect(AdjGraph * G) // 判 断 无 向 图 G 的 连通 性 
Vt 
bool flag= true; 
for (i=0;i<G—>n;i++) //visited 数组 置 初 值 
visited[i] =0; 
DFS(G,0); // 调 用 前 面 的 中 DSF 算法 ,从 顶点 0 开始 深度 优先 遍历 
for (i=0;i<G 一 > nii 十 十 ) 
if (visited[i] ==0) // 车 有 项 点 没有 被 访问 到 ,说 明 是 不 连通 的 
{ flag=false; 
break; 
} 


return flag; 


835 图 遍历 算法 的 应 用 

图 遍历 主要 有 深度 优先 遍历 和 广度 优先 遍历 两 种 方法 ,下 面 讨论 这 两 种 遍历 方法 在 图 
算法 设计 中 的 应 用 及 其 差异 。 扫 一 要 

图 的 深度 优先 遍历 过 程 是 从 初始 点 出 发 ,以 纵向 的 方式 一 步 一 步 向 前 
访问 各 个 顶点 的 ,一 旦 找 不 到 相 邻 的 顶点 就 回 退 。 从 图 8. 9 可 以 看 到 ,DFS 5 
算法 的 执行 过 程 是 DFS(G.2) 一 DFS(CG,.1) 一 DFSCG.0) 一 DFS(CG,3) 一 bi 
DFS(G,4)。 如 果 图 是 连通 的 ,可 以 通过 这 样 的 重复 调用 找 遍 图 G 中 的 所 有 顶点 。 这 种 思 








路 常用 于 图 查找 算法 中 。 aa 


【 例 8. 4】 假设 图 G 采 用 邻接 表 存储 ,设计 一 个 算法 判断 图 G 中 从 顶点 x 到 vw 是 否 存 
在 简单 路 径 。 

所 谓 简 单 路 径 是 指 路 径 上 的 顶点 不 重复 。 采用 深度 优先 遍历 的 方法 ,从 顶点 出 
发 遍历 到 顶点 wv 的 过 程 如 图 8. 13 所 示 。 为 此 在 深度 优先 遍历 算法 的 基础 上 增加 wv 和 has 
两 个 形 参 ,其 中 has 表示 顶点 w 到 wv 是 否 有 路 径 , 其 初 值 为 false, 当 从 顶点 遍历 到 顶点 vw 
后 , 置 has 为 true 并 返回 。 查找 从 顶点 w 到 vw 是 否 存 在 简单 路 径 的 过 程 如 图 8. 14 所 示 。 
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Un=V 


图 8.13 从 顶点 4 到 v 的 深度 优先 遍历 过 程 





AG,u.v.has) 


置 visited[u]=1 , 找 u 的 未 被 访 
| 问 过 的 邻接 点 wu ,并 继续 下 去 








AGu,v,has) 


置 visited[w]=1, 找 ul 的 未 被 访 
问 过 的 邻接 点 ww, 并 继续 下 去 








1 
Guv.has) 
|! 


AG,umv,has) 车 uw=v, 置 has=true 并 返回 

















图 8.14 查找 从 顶点 w 到 vw 是 否 存 在 简单 路 径 
对 应 的 算法 如 下 : 
void ExistPath( AdjGraph * G,int u,int v,bool &has) 


{  V//has 表示 u 到 v 是 否 有 路 径 , 初 值 为 false 
int w;ArcNode *p; 


visited[u] =1; // 置 已 访问 标记 
if (u==v) // 找 到 了 一 条 路 径 
{ has=true; // 置 has 为 true 并 返回 
return; 
} 
p=G -> adjlist[u] .firstarc; //P 指向 项 点 u 的 第 一 个 邻接 点 
while (p!= NULL) 
{ w=p—>adjvex; //w 为 顶点 的 邻接 点 
if (visited[w] ==0) // 若 w 顶点 未 访问 ,递归 访问 它 
ExistPath(G, w,v,has); 
p 一 p 一 > nextarc; //p 指向 顶点 的 下 一 个 邻接 点 
} 


} 





其 中 粗 体 部 分 对 应 深度 优先 遍历 过 程 。 

【 例 8.5】 假设 图 G 采用 邻接 表 存 储 , 设 计 一 个 算法 输出 图 G 中 从 顶点 wx 到 vw 的 一 条 
简单 路 径 ( 假 设 图 G 中 从 顶点 w 到 vw 至 少 有 一 条 简单 路 径 ) 。 

采用 深度 优先 遍历 的 方法 ,从 顶点 x 出 发 找到 顶点 wv 的 一 条 路 径 的 过 程 如 图 8. 15 
所 示 。 为 此 在 深度 优先 遍历 算法 的 基础 上 增加 wv、path 和 4d 几 个 形 参 ,其 中 path 存放 顶点 v 
到 wv 的 路 径 ,d 表示 path 中 的 路 径 长 度 , 其 初 值 为 一 1。 当 从 顶点 遍历 到 顶点 v 后 ,输出 
path 并 返回 。 查 找 从 顶点 x 到 vw 的 一 条 简单 路 径 的 过 程 如 图 8. 16 所 示 。 





OO 


Um=V 


8.15 ”从 顶点 wu 到 vw 的 深度 优先 遍历 找 路 径 的 过 程 





AG.u.v,path,d) 





qd++;path[d]=w; 置 visited[u]j=1， 若 找到 
| 的 未 被 访问 过 的 邻接 点 由， 继续 下 去 





RG.uv,pathd) 





d++;path[d]=wi; 置 visited[u1]=1， 车 找到 
1 的 未 被 访问 过 的 邻接 点 wz， 继续 下 去 








RG,v,path,d) 
+ 


AG,umv,path,d) 若 wn=v， 和 输出 path 并 结束 

















图 8.16 查找 从 顶点 到 wv 的 一 条 简单 路 径 
对 应 的 算法 如 下 : 


void FindaPath( AdjGraph * G,int u,int v,int path[],int d) 
{ //d 表 示 path 中 的 路 径 长 度 , 初 始 为 一 1 
int w,i;ArcNode * p; 
visited[u] =1; 
d+ 十 ; path[d]=u; // 路 径 长 度 d 增 1, 顶 点 u 加 入 到 路 径 中 
if (u==v) // 找 到 一 条 路 径 后 输出 并 返回 
人 or 有 的 ic 一 人 
printf("%d ", path[] ); 
printf("\n"); 





return; 
} 
p=G -> adjlist[u] .firstarc; //p 指向 项 点 u 的 第 一 个 邻接 点 
while (p!= NULL) 
{ w=p—>adjvex; // 邻 接点 的 编号 为 w 

if (visited[w] ==0) 

FindaPath(G,w,v, path, d); 

p=p 一 > nextarc; //p 指向 顶点 u 的 下 一 个 邻接 点 

} 


上 


【 例 8.6】 假设 图 G 采 用 邻接 表 存 储 , 设 计 一 个 算法 输出 图 G 中 从 顶点 扫 - 扫 
u 到 wv 的 所 有 简单 路 径 ( 假 设 图 G 中 从 顶点 wx 到 w 至 少 有 一 条 简单 路 径 ) 。 

本 题 利用 回溯 的 深度 优先 遍历 方法 ,由 于 在 遍历 过 程 中 每 个 顶点 只 访 
问 一 次 ,所 以 这 条 路 径 必定 是 一 条 简单 路 径 。 在 深度 优先 遍历 算法 的 基础 上 eb 
增加 wv、path 和 4d 几 个 形 参 ,其 中 path 存放 顶点 x 到 w 的 路 径 ,d 表示 path 中 视频 讲解 
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的 路 径 长 度 , 其 初 值 为 一 1。 

当 从 顶点 zx 出 发 遍历 时 , 先 将 visited[u] 置 为 1, 并 将 x 加 到 路 径 path 中 ,如 果 满 足 顶 
点 4 就 是 终点 v 的 条 件 , 则 表示 找到 了 一 条 从 顶点 到 w 的 简单 路 径 ,输出 path。 再 从 终点 
v 回 退 ( 置 v 的 访问 标记 为 0) 继 续 找 其 他 路 径 , 也 就 是 说 ,允许 曾经 访问 过 的 顶点 出 现在 男 
外 的 路 径 中 。 查 找 从 顶点 到 vw 的 所 有 简单 路 径 的 过 程 如 图 8. 17 所 示 。 





AG,u,v,path.d) 





置 visited[u]j=1，qd++;path[d]=u; 若 找到 u 的 未 被 访问 过 
| 的 邻接 点 u， 继 续 下 去 ， 否 则 置 visited[uj=0 并 返回 





AG.u.v,path,d) 





置 visited[u]=1，d++;path[d]=ui; 若 找到 的 未 被 访问 
+ 过 的 邻接 点 ww， 继续 下 去 ， 否 则 置 visited[u]=0 并 返回 








AG,us,v,path,d) 


| S 回 退 
+ 


RG.umv.path,d) 若 ww=v， 输 出 path 

















图 8.17 查找 从 顶点 w 到 vw 的 所 有 简单 路 径 
对 应 的 算法 如 下 : 
void FindAllPath( AdjGraph * G,int u,int v,int path[] ,int d) 


{ ”//d 表 示 path 中 的 路 径 长 度 , 初 始 为 一 1 
int w,i;ArcNode * p; 


d 十 十 ; path[d] =u; // 路 径 长 度 d 增 1, 顶点 u 加 入 到 路 径 中 
visited[u] =1; // 置 已 访问 标记 
if (u==v && d>=0) // 车 找到 一 条 路 径 则 输出 


tor(imOisediit ty 
printf(" %2d", path[]); 
printf("\n"); 





1 
p=G —> adjlist[u] .firstarc; //p 指向 顶点 u 的 第 一 个 邻接 点 
while (p!= NULL) 
{ w=p—>adjvex; //w 为 顶点 u 的 邻接 点 
if (visited[w] ==0) // 若 w 顶点 未 被 访问 ,递归 访问 它 
FindAllPath(G, w,v, path, d); 
p=Pp 一 > nextarc; //p 指向 项 点 4 的 下 一 个 邻接 点 
. 
visited[u] =0; // 恢 复 环 境 , 使 该 顶点 可 重新 使 用 


} 


【 例 8.7】 假设 图 G 采 用 邻接 表 存 储 , 设 计 一 个 算法 ,输出 图 G 中 从 顶点 w 到 w 的 长 度 
为 1 的 所 有 简单 路 径 。 

遍历 思路 和 上 例 相 似 , 只 需 将 路 径 输 出 条 件 改 为 二 二 v 且 d= 二 二 1。 查 找 从 顶点 
到 w 的 所 有 长 度 为 1 的 简单 路 径 的 过 程 如 图 8. 18 所 示 。 


PASS 国 





AGuv,l.path.d) 





置 visited[u]=1，d++;path[d]j=w; 车 找到 w 的 未 被 访问 过 
| 的 邻接 点 u， 继 续 下 去 ， 否 则 置 visited[uJ=0 并 返回 





AGuuwv,l,path,d) 





置 visited[u]=1，d++;path[dj=wui; 若 找到 的 未 被 访问 
| 过 的 邻接 点 w， 继 续 下 去 ， 否 则 置 visited[u]=0 并 返回 








RG,u,v,l,path,d) 


AGumv,l,path.d) 若 un=v 且 d==1， 输 出 path 

















图 8.18 查找 从 顶点 4 到 vw 的 所 有 长 度 为 1 的 简单 路 径 


对 应 的 算法 如 下 : 


void PathlenAll( AdjGraph * G,int u,int v,int l,int path[] ,int d) 


{ //d 表示 path 中 的 路 径 长 度 , 初 始 为 一 1 
int w,i;ArcNode * pi; 
visited[u] =1; 
d 十 十 ; path[d] =u; // 路 径 长 度 d 增 1, 顶点 u 加 入 到 路 径 中 
if (u==v && d==1) // 输 出 一 条 路 径 
{ printf(” "); 
for (i=0;i<=d;i 二 十 ) 
pln eam ath 
printf("\n"); 
} 
p=G -> adjlist[u] .firstarc; //p 指向 项 点 u 的 第 一 个 邻接 点 
while (p!= NULL) 
{ w=p—>adjvex; //w 为 uu 的 邻接 点 
if (visited[w] ==0) // 车 该 项 点 未 标记 访问 , 则 递归 访问 之 
PathlenAll(G, w,v,1, path,d); 
p 一 p 一 > nextarc; //p 指向 项 点 u 的 下 一 个 邻接 点 
} 
visited[u] =0; // 恢 复 环境 ,使 该 项 点 可 重新 使 用 
} 
设计 以 下 主 函数 : 
int main() 
{ int path[MAXV]; 


int u=1,v=4,1=3; 
int n=5, e=8; 
int ALMAXV] [MAXV]={{0,1,0,1,1},{1,0,1,1,0}, 
090) LOL Os 
AdjGraph *G; 
CreateAdj(G,A,n,e); // 建 立 图 8. 1(a) 所 示 的 邻接 表 





printf("\n"); 
DestroyAdj(G); 
return 1; 


} 


程序 的 执行 结果 如 下 : 


图 G: 


wo 


1034 
1234 
1304 
1324 


图 8.19 一 个 有 向 图 


int visitedLMAXV] ; 


visited[u] =1; 
d+ 十 ;path[d] =u; 





while (p!= NULL) 
{ w=p—>adjvex; 


if (w==v && 


{ printf(" "); 
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for (int i 一 0;i<n;i 十 十 ) //visited 数组 置 初 值 
visited[1] =0; 
printf(" 图 G:\n");DispAdj(G); // 输 出 邻接 表 


printf(" 从 %d 到 %d 的 所 有 长 度 为 %d 的 路 径 :\n",u,v,D; 
PathAll(G,u,v,1,path, 一 1); 


// 销 毁 邻 接 表 


0: 10] >3[1] 一 4D] 一 人 

0[] 一 2[ 一 3[] 一 人 

1 一 50 一 4D 一 大 

00D] 一 1[ 一 20] 4[1] 一 人 
00] >2[1] 一 301] 一 人 

从 顶点 1 到 4 的 所 有 长 度 为 3 的 路 径 : 


【 例 8.8】 假设 有 向 图 G 采 用 邻接 表 存 储 , 设 计 一 个 算法 , 求 
图 中 通过 某 顶 点 & 的 所 有 简单 回路 ( 若 存在 ) ,并 输出 如 图 8. 19 所 
示 的 有 向 图 的 邻接 表 和 通过 顶点 0 的 所 有 简单 回路 。 

所 谓 简单 回路 是 指 路 径 上 的 顶点 不 重复 ,但 第 一 个 顶点 
与 最 后 一 个 顶点 相同 的 回路 。 利 用 回溯 的 深度 优先 搜索 方法 从 
顶点 开始 搜索 与 之 相 邻 的 顶点 包 , 若 w 等 于 顶点 v, 且 路 径 长 
度 大 于 1, 表示 找到 了 一 条 回路 ,输出 path 数组 ,然后 继续 搜索 
顶点 “ 的 未 访问 的 邻接 点 查找 其 他 回路 。 对 应 的 算法 如 下 : 

// 全 局 变量 


void DFSPath( AdjGraph * G,int u,int v,int path[] ,int d) 
{ //d 表示 path 中 的 路 径 长 度 ,初始 为 一 1 
int w,i;ArcNode * p; 

















p=G -> adjlist[u] . firstarc; //p 指向 顶点 u 的 第 一 个 邻接 点 
//w 为 顶点 u 的 邻接 点 
d>1) // 找 到 一 个 回路 ,输出 之 视频 讲解 


for (i=0i<=dit ty 
printf("%d ", path[]); 
printf("%d \n",v); 


274 


ASS 国 


} 


if (visited[w] ==0) // 若 w 未 被 访问 , 则 递归 访问 之 
DFSPath(G, w,v,path,d); 
p=p—> nextarc; // 找 u 的 下 一 个 邻接 点 
} 
visited[u] =0; // 恢 复 环境 ,使 该 顶点 可 重新 使 用 


} 
void FindCyclePath( AdjGraph * G,int k) // 输 出 经 过 顶点 k 的 所 有 回路 
{ int path[MAXV]; 
DFSPath(G, k, k, path, —1); 
} 


设计 以 下 主 函 数 : 


int main( ) 
{ intn=5, e=7; 
int A[MAXV] [MAXV]={ 
{0,1,1,0,0},{0,0,1,0,0},{0,0,0,1,1}, {0,0,0,0,1},{1,0,0,0,0)}); 


AdjGraph * G; 

CreateAdj(G,A,n,e); // 建 立 图 8.19 所 示 的 邻接 表 

for (int i=0;i<n;it 十 ) //visited 数组 置 初 值 
visited[] =0; 

printf(" 图 G:\n");DispAdj(G); // 输 出 邻接 表 

int k=0; 


printf(" 图 G 中 经 过 顶点 %d 的 所 有 回路 :\n",k); 
FindCyclePath(G, k); 

printf("\n"); 

DestroyAdj(G); // 销 毁 邻 接 表 
return 1; 


} 
程序 的 执行 结果 如 下 : 


图 G: 

IE JE 
il 

3[1] —4[1] 一 人 
4 

2 1 

图 G 中 经 过 顶点 0 的 所 有 回路 
012340 

01240 

02340 


wo 





0240 aa 


昌 昌 

图 的 广度 优先 遍历 算法 是 从 初始 点 « 出 发 ,以 横向 方式 一 步 一 步 向 前 
访问 各 个 顶点 的 , 即 访问 过 程 是 一 层 一 层 地 向 前 推进 的 。 从 图 8.12 可 以 看 
到 ,每 次 都 是 从 一 个 顶点 w 出 发 找 所 有 相 邻 的 未 被 访问 过 的 顶点 wu vi， 全 机 汪 
wi ,并 按 tits，… su 依次 进 队 , 车 采用 非 环形 队列 (出 队 后 的 顶点 仍 在 队 as 
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列 中 ) , 则 队列 中 的 每 个 顶点 都 有 唯一 的 前 驱 顶 点 ,可 以 利用 这 一 特征 采用 广度 优先 遍历 算 
法 找 从 顶点 x 到 顶点 的 最 短路 径 。 
【 例 8.9】 假设 图 G 采用 邻接 表 存储 ,设计 一 个 算法 , 求 不 带 权 无 向 连通 图 G 中 从 顶点 
4 到 顶点 的 一 条 最 短路 径 。 
国 图 G 是 不 带 权 的 无 向 连通 图 ,一 条 边 的 长 度 计 为 
1, 因 此 求 顶 点 w 和 顶点 v 的 最 短路 径 即 求 距离 顶点 v 到 顶 
csE 点 的 边 数 最 少 的 顶点 序列 。 利 用 广度 优先 遍历 算法 ,从 
4 出 发 进行 广度 遍历 类 似 于 从 顶点 出 发 一 层 一 层 地 向 外 
图 8.20 查找 顶点 4 和 项 点 的 扩展 ' 当 第 一 次 找到 顶点 时 队列 中 便 包 含 了 从 顶点 « 到 
最 短路 径 顶点 4 的 最 短路 径 ,如 图 8. 20 所 示 , 再 利用 队列 输出 最 短 
路 径 (道路 径 序 列 ) 。 
由 于 要 利用 队列 找 出 路 径 ,所 以 设计 成 非 环形 队列 ,其 类 型 声明 如 下 ， 


typedef struct 


{ int data; // 顶 点 编号 
int parent; // 前 一 个 顶点 的 位 置 
) QUERE; // 非 环形 队列 类 型 


在 算法 中 直接 用 qu 数组 存放 队列 中 的 元 素 , 用 front 和 rear 两 个 整 型 变量 分 别 作 为 队 
头 、 队 尾 指针 。 对 应 的 算法 如 下 : 
void ShortPath( AdjGraph * G,int u,int v) 


{  // 输 出 从 顶点 u 到 顶点 v 的 最 短 逆 路 径 
ArcNode * p;int w,i; 


QUERE qu[LMAXV] ; // 非 环形 队列 

int front 一 一 1,rear 一 一 1; // 队 列 的 头 、 尾 指针 

int visited[MAXV]; 

for (i=0;i<G 一 > nii 十 十 ) // 访 问 标记 置 初 值 0 
visited[ 加 一 0; 

rear 十 十 ; // 顶 点 u 进 队 


qu[rear] .data=u; 
qu[rear] . parent 一 一 1; 


visited[u] =1; 

while (front!= rear) // 队 不 空 循环 

nt 二 // 出 队 顶 点 w 
w=qu[front] . data; 
if (w==v) // 找 到 v 时 输出 路 径 之 逆 并 退出 
{ i=front; // 通 过 队列 输出 逆 路 径 





while (qu[i] .parent!=—1) 
{ printf("%2d",qu[d.data); 
i= qu[i] . parent; 
} 
printf("%2d\n", qu[i] .data); 
return; 
} 
p=G —> adjlist[w] .firstarc; // 找 w 的 第 一 个 邻接 点 
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while (p!=NULL) 
{ if(visited[p—>adjvex]==0) 
{ visited[p—>adjvex]=1; 
rear 十 十 ; 
qu[rear] .data=p —> adjvex; 
qu[rear] . parent= front; 
} 


p=p 一 > nextarc; 


} 


// 将 w 的 未 访问 过 的 邻接 点 进 队 


// 找 ww 的 下 一 个 邻接 点 


通过 本 算法 求 得 ,在 图 8. 19 中 顶点 0 到 顶点 4 的 最 短 道路 径 为 4、2、0。 


【 例 8. 10】 
顶点 v 最 远 的 一 个 顶点 。 


假设 图 G 采 用 邻接 表 存 储 , 设 计 一 个 算法 , 求 不 带 权 无 向 连通 图 G 中 距离 


图 G 是 不 带 权 的 无 向 连通 图 ,一 条 边 的 长 度 计 为 1, 因 此 求 距离 顶点 " 的 最 远 的 顶 
点 即 求 距离 顶点 v 的 边 数 最 多 的 项 点。 利用 广度 优先 遍历 算法 ,从 顶点 二 出 发 进行 广度 遍 


历 类 似 于 从 顶点 vv 出 发 一 层 一 层 地 向 外 扩展 ,到 达 顶 点 j,…… 


离 v 最 远 的 顶点 ,如 图 8. 21 所 示 。 在 遍历 时 利用 一 个 队 
列 逐 层 暂 存 各 个 顶点 ,最 后 出 队 的 一 个 顶点 即 为 所 求 。 

由 于 本 题 只 需要 求 距离 顶点 wv 最 远 的 一 个 顶点 ,不 
需要 求 路 径 ,所 以 采用 的 队列 可 以 是 环形 队列 。 和 上 例 
一 样 , 直 接 用 qu 数组 存放 队列 中 的 元 素 ,用 front 和 rear 


,最 后 到 达 的 一 个 顶点 & 即 为 距 


Es 


图 8.21 查找 距离 顶点 v 最 远 的 


两 个 整 型 变量 分 别 作为 队 头 、 队 尾 指针 。 
对 应 的 算法 如 下 : 


int Maxdist(AdjGraph * G,int v) 
{ ArcNode * pi; 
int Qu[MAXV]; 
int front=0, rear=0; 
int visitedLMAXV] ; 
int i,j,k; 
for (i 一 0;ii<G 一 > nii 十 十 ) 
visited[i] =0; 
rear 十 十 ;Qu[rear] =v; 
visited[v] =1; 
while (rear!=front) 
{ front=(front+1)%MAXV; 
k= Qul[front] ; 
p=G —> adjlist[k] .firstarc; 
while (p!= NULL) 
{ j=p—>adjvex; 
if (visited0] ==0) 
{ visitedD]=1; 


rear 一 (rear 十 1)%MAXV; 


Qu[rear] =j; 


顶点 


// 环 形 队列 数组 
// 队 列 的 头 、 尾 指针 
// 访 问 标记 数组 


// 初 始 化 访问 标记 数组 


// 顶 点 v 进 队 
// 标 记 v 已 访问 





// 顶 点 k 出 队 

// 找 第 一 个 邻接 点 

// 所 有 未 被 访问 过 的 邻接 点 进 队 
// 邻 接点 为 顶点 j 

// 若 j 未 被 访问 过 


// 顶 点 j 进 队 
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p=p 一 nextarc; // 找 下 一 个 邻接 点 
3} 
} 
return k; 


} 


通过 本 算法 求 得 图 8. 1(a) 中 离 顶 点 0 距离 最 远 的 是 顶点 2。 





3 用 图 沁 历 方法 求解 迷宫 问题 


在 第 3 章 介 绍 了 用 栈 和 队列 求解 迷宫 问题 ,实际 上 迷宫 就 是 一 个 图 ,用 
栈 搜索 迷宫 路 径 采 用 的 是 深度 优先 遍历 ,而 用 队列 搜索 迷宫 路 径 采 用 的 是 广 
度 优先 遍历 。 

在 采用 图 算法 求解 迷宫 问题 时 首先 要 创建 迷宫 图 对 应 的 邻接 表 , 图 8. 22 
所 示 的 是 一 个 小 迷宫 图 对 应 的 邻接 表 , 迷 宫 中 的 一 个 可 走 方 块 (人力 对 应 一 
个 顶点 ,邻接 表 的 头 结 点 是 一 个 二 维 数组 。 对 应 的 邻接 表 类 型 声明 如 下 : 





typedef struct ANode 
{ inti, j; 
struct ANode * nextarc; 
} ArcNode; // 边 结 点 类 型 
typedef struct Vnode 
{ 
ArcNode * firstarc; // 指 向 第 一 个 相 邻 可 走 方块 
} VNode; 
typedef struct 
{ 
VNode adjlist[M 十 2] [N 十 2] ; ”// 头 结 点 数组 
) AdjGraph:; // 迷 宫 图 的 邻接 表 类 型 


adjlist[Ay+2][N+2 
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图 8.22 由 迷宫 产生 的 邻接 表 

















视频 讲解 


在 搜索 迷宫 路 径 时 可 以 采用 DFS 或 者 BFS 算法 ,将 访问 标记 数组 改 为 visitedLM 十 2] 
[LN 十 2]( 其 中 MN 表示 迷宫 的 行 、 列 数 )。 入 口 作为 初始 项 点 ,结束 条 件 为 找到 出 口 。 
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采用 回溯 的 DFS 求解 迷宫 问题 时 可 以 搜索 从 入 口 到 出 口 的 所 有 迷宫 路 径 ,采用 BFS 
算法 求解 迷宫 问题 时 可 以 搜索 从 入 口 到 出 口 的 最 短路 径 。 


当 在 一 个 不 带 权 图 中 搜索 从 顶点 “到 的 一 条 路 径 时 ,采用 DFS 求 出 的 路 径 不 一 定 是 
最 短路 径 ,而 采用 BFS 求 出 的 路 径 一 定 是 最 短路 径 , 这 是 为 什么 呢 ? 

以 图 8. 23(a) 为 例 , 假 设 搜索 路 径 的 起 点 为 顶点 0、 终 点 为 顶点 4。 从 图 
中 可 以 看 出 : 

0 习 1 的 最 短路 径 为 (0,1) ,长 度 为 1; 

0 一 2 的 最 短路 径 为 (0,1,2) 或 者 (0,3,2) ,长 度 为 2; 

0 一 3 的 最 短路 径 为 (0,3) ,长 度 为 1; 

0 一 4 的 最 短路 径 为 (0,3,4) ,长 度 为 2。 

按 最 短路 径 长 度 将 顶点 分 层 , 顶 点 1 和 3 的 最 短路 径 长 度 为 1, 放 在 第 1 层 ; 顶点 2 和 4 
的 最 短路 径 长 度 为 2, 放 在 第 2 层 。 其 结果 如 图 8. 23(b) 所 示 。 























(a) 一 个 图 (b) 以 起 点 到 该 项 点 的 最 短路 径 构成 的 分 层 


图 8.23 一 个 图 和 按 最 短路 径 分 层 


在 采用 DFS 算法 时 求 出 的 一 条 可 能 的 路 径 是 (0,1,2,4), 其 中 顶点 2、4 在 同一 层 中 ; 
而 采用 BFS 算法 求 出 的 一 条 路 径 只 能 是 (0,3,4)。 也 就 是 说 ,DFS 算法 求 出 的 路 径 中 的 顶 
点 可 能 在 同一 层 中 ,所 以 该 路 径 不 一 定 是 最 短路 径 ,而 BFS 算法 求 出 的 路 径 中 的 所 有 顶点 
一 定 在 不 同 层 中 ,所 以 该 路 径 一 定 是 最 短路 径 。 


生成 树 和 最 小 生成 树 关 


841 生成 树 的 概念 


一 个 连通 图 的 生成 树 (spanning tree) 是 一 个 极 小 连通 子 图 ,其 中 含有 
图 中 的 全 部 顶点 ,和 构成 一 棵 树 的 (x 一 1) 条 边 。 如 果 在 一 棵 生成 树 上 添加 
任何 一 条 边 ,必定 构成 一 个 环 ,因为 添加 的 这 条 边 使 得 它 关联 的 那 两 个 顶点 视频 讲解 
之 间 有 了 第 2 条 路 径 。 

一 棵 及 n 个 顶点 的 生成 树 ( 连 通 无 回路 图 ) 有 且 仅 有 (mn 一 1) 条 边 。 如 果 一 个 图 及 个 顶 
点 和 小 于 (n 一 1) 条 边 , 则 是 非 连 通 图 。 如 果 它 多 于 (n 一 1) 条 边 , 则 一 定 有 回路 。 
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对 于 一 个 带 权 (假设 每 条 边 上 的 权 均 为 大 于 零 的 实数 ) 连 通 无 向 图 G 中 的 不 同 生成 树 ， 
其 每 棵 树 的 所 有 边 上 的 权 值 之 和 也 可 能 不 同 ; 图 的 所 有 生成 树 中 具有 边 上 的 权 值 之 和 最 小 
的 树 称 为 图 的 最 小 生成 树 (minimal spanning tree) 。 

按照 生成 树 的 定义 ,n 个 顶点 的 连通 图 的 生成 树 有 nn 个 顶点 、(n 一 1) 条 边 。 因 此 ,构造 
最 小 生成 树 的 准则 有 以 下 3 条 : 

(1) 必须 只 使 用 该 图 中 的 边 来 构造 最 小 生成 树 ; 

(2) 必须 使 用 且 仅 使 用 (n 一 1) 条 边 来 连接 图 中 的 个 顶点 ; 

(3) 不 能 使 用 产生 回路 的 边 。 

求 图 的 最 小 生成 树 有 很 多 实际 应 用 ,例如 城市 之 间 的 交通 工程 造价 最 优 问题 就 是 一 个 
最 小 生成 树 问题 。 求 图 的 最 小 生成 树 的 两 个 算法 即 普 里 姆 算法 和 克 鲁 斯 卡尔 算法 ,将 分 别 
在 后 面 介绍 。 扫 -- 扫 


842 无 向 图 的 连通 分 量 和 生成 树 


在 对 无 向 图 进行 遍历 时 ,若是 连通 图 , 仅 需 调用 遍历 过 程 (DFS 或 BFS) 回 吕 相生 站 
一 次 ,从 图 中 的 任 一 顶点 出 发 便 可 以 遍历 图 中 的 各 个 顶点 。 若 是 非 连通 图 ， 入 本 
则 需 多 次 调用 遍历 过 程 ,每 次 调用 得 到 的 顶点 集 连 同 相关 的 边 就 构成 了 图 的 一 个 连通 分 量 。 

设 G=(V,E) 为 连通 图 , 则 从 图 中 的 任 一 顶点 出 发 遍历 图 时 必定 将 E(G) 分 成 两 个 集合 
T 和 B, 其 中 了 是 遍历 图 过 程 中 走 过 的 边 集合 ,B 是 剩余 的 边 集 合 : TN B=8B,TUB= 
E(G)。 显 然 ,G' 二 (V,T) 是 G 的 极 小 连通 子 图 , 即 G' 是 G 的 一 棵 生成 树 。 

由 深度 优先 遍历 得 到 的 生成 树 称 为 深度 优先 生成 树 (DFS tree) 。 在 深度 优先 遍历 中 ， 
如 果 将 每 次 “前 进 ”( 纵 向 ) 路 过 的 (将 被 访问 ) 顶 点 和 边 都 记录 下 来 ,就 得 到 了 一 个 子 图 ,该 子 
图 为 以 出 发 点 为 根 的 树 ,就 是 深度 优先 生成 树 。 相 应 地 ,由 广度 优先 遍历 得 到 的 生成 树 称 为 
广度 优先 生成 树 (BFS tree) 。 






















这 样 的 生成 树 由 遍历 时 访问 过 的 个 顶点 和 遍历 时 经 历 的 
(n 一 1) 条 边 组 成 。 

对 于 非 连 通 图 ,每 个 连通 分 量 中 的 顶点 集 和 遍历 时 走 过 的 边 
一 起 构成 一 棵 生成 树 , 各 个 连通 分 量 的 生成 树 组 成 非 连 通 图 的 生 
成 森林 (spanning forest) 。 

【 例 8.11】 对 于 如 图 8. 24 所 示 的 图 G, 夯 出 其 邻接 表 存储 
结构 ,并 在 该 邻接 表 中 以 顶点 3 为 根 画 出 图 G 的 深度 优先 生成 树 
和 广度 优先 生成 树 。 

图 G 的 邻接 表 如 图 8. 25 所 示 ( 注 意 ,图 G 的 邻接 表 不 是 唯一 的 ) 。 对 于 该 邻接 表 ， 
从 顶点 3 出 发 的 深度 优先 遍历 过 程 如 下 : 


3 一 0 -一 1 —— 4 





图 8.24 无 向 图 G 
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图 8.25 图 G 的 邻接 表 


将 两 个 顶点 之 间 的 一 条 连 线 构成 深度 优先 生成 树 的 一 条 边 ,因此 对 应 的 深度 优先 生成 
树 如 图 8. 26(a) 所 示 。 
从 顶点 3 出 发 的 广度 优先 遍历 过 程 如 下 : 
人 
2 一 后 :和 
6 一 一 8 


9 
T= 10 


同样 ,将 两 个 顶点 之 间 的 一 条 连 线 构成 广度 优先 生成 树 的 一 条 边 ,因此 对 应 的 广度 优先 
生成 树 如 图 8. 26(b) 所 示 。 
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843 普 里 姆 算法 

普 里 姆 (Prim) 算 法 是 一 种 构造 性 算法 。 假 设 G==(V.,E) 是 一 个 具有 个 顶点 的 带 权 连 
通 图 ,T=(U,TE) 是 G 的 最 小 生成 树 , 其 中 U 是 T 的 顶点 集 ,TE 是 工 的 边 集 , 则 由 G 构造 
从 起 始点 vw 出 发 的 最 小 生成 树 T 的 步骤 如 下 : 

(1) 初始 化 U={z} ,以 wv 到 其 他 顶点 的 所 有 边 为 候选 边 。 
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(2) 重复 以 下 步骤 (n 一 1) 次 ,使 得 其 他 (一 了 个 顶点 被 加 入 到 UU 中 。 

@ 从 候选 边 中 挑选 权 值 最 小 的 边 加 入 TE, 设 该 边 在 V 一 U 中 的 顶点 是 ,将 & 加 入 口中 ; 

@ 考查 当前 V 一 U 中 的 所 有 顶点 j ,修改 候选 边 , 若 (k,j) 的 权 值 小 于 原来 和 顶点 j 关 
联 的 候选 边 , 则 用 (&, 站 取代 后 者 作为 候选 边 。 


计算 机 科学 家 简介 
i Robert Clay Prim(1921 年 出 生 ) ,美国 数学 家 和 计算 机 科学 家 ， 
1941 年 获得 电气 工程 学 士 学 位 , 1949 年 从 普林斯顿 扫 - 扫 
i 大 学 获得 数学 博士 学 位 。 在 第 二 次 世界 大 战 (1941 一 | 
1944 年 ) 期 间 , 他 担任 通用 电气 工程 师 。1944 一 1949 
年 ,他 受聘 于 美国 海军 军械 实验 室 担 任 工 程 师 , 后 来 E 
成 为 数学 家 。1958 一 1961 年 ,他 在 贝尔 实验 室 时 担任 视频 讲解 
数学 研究 部 主任 ,1957 年 提出 了 Prim 算法 。 
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的 过 程 如 下 : 
28 (1) 首先 的 最 小 生成 树 工 仅 包含 所 有 的 顶点 ,如 图 8. 28(a) 
所 示 。 

(2) U={0},V 一 U={1,2,3,4,5,6) ,在 这 两 个 顶点 集 之 间 选 
2) 择 第 1 条 最 小 边 (0.5) 添 加 到 工 中 ,如 图 8. 28(b) 所 示 。 
12 (3) U={0,5},V 一 U= 二 {1,2,3,4,6) ,在 这 两 个 顶点 集 之 间 选 
择 第 2 条 最 小 边 (5,4) 添 加 到 工 中 ,如 图 8. 28(c) 所 示 。 

(4) 依 此 类 推 , 中 间 步 骤 如 图 8. 28(d) 一 (g) 所 示 , 直 到 U 中 包含 所 
有 的 顶点 ,这 样 一 共 选 择 了 6 条 边 , 产 生 的 最 小 生成 树 为 图 8. 28(g) 。 
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图 8.27 一 个 带 权 连 通 图 
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(a) 仅 包含 所 有 顶点 





(b) 选择 第 1 条 边 (0，5) 
8.28 ”用 普 里 姆 算法 求解 最 小 生成 树 的 过 程 
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(g) 选择 第 6 条 边 (1，6) 


8.28 ( 续 ) 
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从 上 例 可 以 看 出 ,Prim 算法 是 一 种 增 量 算法 ,一 步 一 步 地 选择 最 小 边 , 并 在 U 集合 中 
添加 相应 的 顶点 ,每 一 步 都 是 从 U 和 V 一 U 两 个 顶点 集合 中 选择 最 小 边 , 而 且 每 一 步 都 是 
在 前 面 的 基础 上 进行 的 。 

下 面 的 Prim(g,v) 算 法 利用 上 述 过 程 来 构造 最 小 生成 树 , 其 中 参数 g 为 邻接 矩阵 vw 为 

由 于 Prim 算法 中 需要 频繁 地 取 一 条 条 边 的 权 , 所 以 图 采用 邻接 矩阵 更 合适 。 

Prim 算法 中 的 候选 边 是 指 集合 OU 和 V 一 U 之 间 的 所 有 边 ( 称 为 U 和 V 一 U 两 个 顶点 集 
合 的 割 集 ) ,如 果 把 这 些 边 都 保存 起 来 是 非常 消耗 空间 的 ,实际 上 考虑 候选 边 的 目的 是 求 U 
和 V 一 U 之 间 的 最 小 边 ( 指 权 最 小 的 边 ) 。 为 此 只 考虑 V 一 U 集合 的 顶点 (因为 两 个 顶点 集 
之 间 的 边 是 无 向 边 ) ,建立 两 个 数组 closest 和 lowcost, 用 于 记录 V 一 U 中 顶点 j 到 U 中 项 
点 的 最 小 边 。 

Uloweost[i]=0) -Ulowecostlj]#0) 对 于 V 一 U 中 的 一 个 顶点 j , 它 的 最 小 边 对 应 U 
中 的 某 个 顶点 ,用 closest[j] 保 存 U 中 的 这 个 顶点 ， 
如 图 8. 29 所 示 , 顶 点 j 的 最 小 边 对 应 U 中 的 顶点 
& ,有 closest[j] 二 ,并 且 用 lowcost[j] 存 储 该 最 小 
边 的 权 。 也 就 是 说 ,这 样 的 最 小 边 为 (closest[j] ,站 





en 顶点 /到 的 最 小 边 边 , 对 应 的 权 为 lowcost[j]。 
= 占 公 永 县 
图 8629 牟 吉 ;到 局 的 最 小 过 前 那么 如 何 确定 个 顶点 属于 U 集合 还 是 属于 
存储 方式 V 一 口 集合 呢 ? 这 里 的 约定 是 车 某 个 顶点 i 有 


lowcost[ 门 ==0, 表 示 i EU; 车 0 二 lowcost[i] 二 吕 

(或 者 lowcost[ 门 去 0) ,表示 iE€V 一 U。 

初始 时 ,U 中 只 有 一 个 顶点 v。 对 于 所 有 顶点 i, 这 时 (v, 店 边 就 是 顶点 i 到 UU 的 最 小 
边 , 置 lowcost[ 门 二 g. edges[vj[ij( 没 有 边 时 为 2O,v 到 w 为 0),closest[i]= 二 wv。 由 于 
lowcost[v] 已 经 被 置 为 0, 表示 它 添加 到 UU 集合 中 了 。 

在 候选 边 中 求 一 条 最 小 边 的 过 程 是 扫描 V 一 U 中 的 所 有 顶点 j ,通过 比较 lowcost 值 求 
出 最 小 lowcost 值 对 应 的 顶点 ,那么 (closest[k],k) 就 是 最 小 边 , 输 出 这 条 最 小 边 , 并 将 顶 
点 上 添加 到 UU 中 , 即 置 lowcost[k]==0。 

接着 做 调整 ,也 就 是 修改 候选 边 ,也 仅仅 考虑 V 一 U 集合 的 顶点。 对 于 j EV 一 U( 即 
lowcost[j]! 二 0) ,在 上 一 步 ( 顶 点 上 还 没有 添加 到 U 中 时 )lowcost[) 站 保存 的 是 顶点 j 到 U 
中 顶点 closest[ 站 的 最 小 边 , 而 现在 U 发 生 了 改变 (改变 是 仅仅 在 UU 中 增加 了 顶点 &), 所 以 
需要 将 原来 的 lowcost[ 门 与 g. edges[k][ 门 进行 比较 ,如 果 g. edges[k][7] 小 ,选择 (k,j) 作 为 新 
的 最 小 边 , 即 置 lowcost[ 站 二 g. edges[k][ 门 ,closest[ 站 二 k, 否 则 顶点 j 的 候选 边 不 改变 。 

对 应 的 Prim 算法 如 下 : 


void Prim(MatGraph g, int v) 
{ int lowcostLMAXV] ; 
int MIN; 
int closestLMAXV] ,i,j, k; 
for (i 王 0;i<g.n;i 十 十 ) // 给 lowcost[] 和 closest[] 园 初 值 
{ lowcost[i]=g.edges[v] [i]; 
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closest[] =v; 


} 


for (i=1;i<g.nii 十 十 ) // 找 出 Cn 一 1) 个 顶点 
{ MIN=INF; 
for (j 王 0;j < g.njj 十 十 ) // 在 (V 一 串 中 找 出 离 U 最 近 的 顶点 k 


if (lowcostD]!=0 && lowcostD]< MIN) 
{ MIN=lowcostD]; 


k=j; //kk 记 录 最 近 顶 点 的 编号 
} 
printf(" 边 (%d, %d) 权 为 :%d\n",closest[k],k, MIN); ”// 输 出 最 小 生成 树 的 一 条 边 
lowcost[k] =0; // 标 记 k 已 经 加 入 U 
for (j=0;j<g.n;j+ 十 ) // 对 (V 一 U) 中 的 顶点 j 进行 调整 


if (lowcost[] !=0 ®&& g.edges[k] 中 < lowcost0]) 
{lowcost[]=g.edges[k] 0]; 

closest[)] =k; // 修 改 数 组 lowcost 和 closest 
} 


} 


Prim() 算 法 中 有 两 重 for 循环 ,所 以 时 间 复 杂 度 为 O(n*), 其 中 为 图 的 顶点 个 数 。 大 
家 可 以 看 出 ,Prim() 算 法 的 执行 时 间 与 图 中 的 边 数 e 无 关 , 所 以 它 特别 适合 用 稠密 图 求 最 小 
生成 树 。 
844 克 鲁 斯 卡尔 算法 

克 鲁 斯 卡尔 (Kruskal) 算 法 是 一 种 按 权 值 的 递增 次 序 选择 合适 的 边 来 构造 最 小 生成 树 
的 方法 。 假 设 G=(V,E) 是 一 个 具有 个 顶点 的 带 权 连通 无 向 图 ,T= 二 (U,TE) 是 G 的 最 小 
生成 树 , 则 构造 最 小 生成 树 的 步骤 如 下 : 

(1) 置 U 的 初 值 为 V( 即 包含 有 G 中 的 全 部 顶点 ) ,TE 的 初 值 为 空 集 ( 即 图 了 中 的 每 一 
个 顶点 都 构成 一 个 分 量 )。 

(2) 将 图 G 中 的 边 按 权 值 从 小 到 大 的 顺序 依次 选取 ,车 选取 的 边 未 使 生成 树 T 形 成 回 
路 , 则 加 入 TE, 和 否则 舍弃 ,直到 TE 中 包含 (n 一 1) 条 边 为 止 。 

对 于 图 8. 27 所 示 的 带 权 连通 图 ,采用 Kruskal 算法 构造 最 小 生成 树 的 过 程 如 下 : 

(1) 将 所 有 边 按 权 值 递增 排序 ,其 结果 如 图 8. 30(a) 所 示 。 图 中 边 上 的 数字 表示 该 边 是 
第 几 小 的 边 ,如 1 表示 是 最 小 的 边 ,2 表示 是 第 2 小 的 边 , 依 此 类 推 。 
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Joseph Bernard Kruskal(1928 一 2010 年 ) ,美国 数学 家 ,统计 学 家 和 
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(2) 首先 的 最 小 生成 树 T 仅 包含 所 有 的 顶点 ,如 图 8. 30(b) 所 示 。 

(3) 选取 最 小 边 (0,5) 直 接 加 入 到 工 中 ,此 时 不 会 出 现 回路 ,如 图 8. 30(c) 所 示 。 

(4) 选取 第 2 小 的 边 (2,3) 直 接 加 入 到 工 中 ,此 时 不 会 出 现 回路 ,如 图 8. 30(d) 所 示 。 

说 明 : 在 采用 Kruskal 算法 构造 最 小 生成 树 时 ,前面 的 两 条 边 可 以 直接 加 入 到 下 中 , 因 
为 只 有 两 条 边 的 图 不 可 能 存在 回路 。 

(5) 选取 第 3 小 的 边 (1,6) ,加 入 到 工 中 不 会 出 现 回路 ,将 其 加 入 ,如 图 8. 30(e) 所 示 。 

(6) 选取 第 4 小 的 边 (1,2) ,加 入 到 工 中 不 会 出 现 回路 ,将 其 加 入 ,如 图 8. 30(f) 所 示 。 

(7) 选取 第 5 小 的 边 (3,6) ,加 入 到 工 中 会 出 现 回路 ,舍弃 它 。 选 取 第 6 小 的 边 (3,4)， 
加 入 到 T 中 不 会 出 现 回路 ,将 其 加 入 ,如 图 8. 30(g) 所 示 。 

(8) 选取 第 7 小 的 边 (4,6) ,加 入 到 工 中 会 出 现 回 路 ,舍弃 它 。 选 取 第 8 小 的 边 (4,5)， 
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(e) 选择 第 3 条 边 
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人) 选择 第 5 条 边 (h) 选择 第 6 条 边 
图 8. 30 用 克 重 斯 卡尔 算法 求解 最 小 生成 树 的 过 程 
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加 入 到 工 中 不 会 出 现 回路 ,将 其 加 入 ,如 图 8. 30(h) 所 示 。 

这 样 一 共 选 择 了 6 条 边 , 产 生 的 最 小 生成 树 为 图 8. 30(h)。 从 中 可 以 看 出 ,这 里 
Kruskal 算法 和 Prim 算法 的 求解 结果 相同 。 实 际 上 , 当 一 个 图 有 多 个 最 小 生成 树 时 ,这 两 
个 算法 的 求解 结果 不 一 定 是 相同 的 。 

下 面 的 Kruskal(g) 算 法 利用 上 述 过 程 来 构造 最 小 生成 树 , 其 中 参数 g 为 邻接 矩阵 。 和 
Prim 算法 一 样 ,在 该 算法 中 需要 频繁 地 取 一 条 条 边 的 权 , 所 以 图 采用 邻接 矩阵 更 合适 。 

设计 Kruskal 算法 的 关键 是 如 何 判断 选取 一 条 边 (i, 力 加 入 到 工 中 是 否 出 现 回路 ,可 以 
通过 判断 顶点 i\j 是 否 属于 同一 个 连通 分 量 的 方法 来 解决 。 

为 此 设置 一 个 辅助 数组 vset[0..n 一 1],vset[ 避 用 于 记录 一 个 顶点 i 所 在 的 连通 分 量 编 
号 。 初 值 时 每 个 顶点 构成 一 个 连通 分 量 , 所 以 有 vset[ 门 =i,vset[jj] 二 j( 所 有 顶点 的 连通 分 
量 编 号 等 于 该 顶点 编号 )。 当 选中 (i,j) 边 时 ,如 果 顶 点 二) 的 连通 分 量 编号 相同 ,表示 加 入 
后 会 出 现 回 路 ,不 能 加 入 ; 否则 表示 加 入 后 不 会 出 现 回 路 ,可 以 加 入 ,然后 将 这 两 个 顶点 所 
在 连通 分 量 中 所 有 顶点 的 连通 分 量 编号 改 为 相同 ( 改 为 vset[ 门 或 者 vset[ 站 均 可 )。 

例如 ,对 于 如 图 8. 31(a) 所 示 的 带 权 连通 图 (所 有 边 按 权 值 递增 排序 ) ,采用 Kruskal 算 
法 构造 最 小 生成 树 的 过 程 如 下 : 

(1) 首先 的 最 小 生成 树 T 仅 包 含 所 有 的 顶点 ,如 图 8. 31(b) 所 示 , 顶 点 旁边 的 数字 为 该 
顶点 的 连通 分 量 编号 。 

(2) 选取 最 小 边 (0,3) ,顶点 0、3 的 连通 分 量 编号 分 别 为 0.3 ,两 者 不 相同 ,表示 加 入 到 
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(b) 仅 包含 所 有 项 点 
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(9) 选择 第 1 条 边 








(e) 选择 第 3 条 边 : 选 (2,0) 边 时 出 现 回路 
8.31 判断 加 入 一 条 边 是 否 出 现 回路 
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T 中 不 会 出 现 回路 ,将 其 加 入 ,并 将 顶点 0、3 合并 后 的 连通 分 量 中 所 有 顶点 的 连通 分 量 编号 
改 为 0, 如 图 8. 31(c) 所 示 。 

(3) 选取 第 2 小 的 边 (2,3) ,和 (2) 相 类 似 , 将 其 加 入 ,如 图 8. 31(d) 所 示 。 

(4) 选取 第 3 小 的 边 (0,2) ,顶点 0、2 的 连通 分 量 编号 都 是 0, 两 者 相同 ,表示 加 入 到 了 
中 会 出 现 回 路 ,舍弃 它 。 选 取 第 4 小 的 边 (0,1), 加 入 到 工 中 不 会 出 现 回 路 ,将 其 加 入 ,如 
图 8. 31(e) 所 示 。 

另外 ,用 一 个 数组 E[ ] 存 放 图 G 中 的 所 有 边 ,要 求 它 们 是 按 权 值 从 小 到 大 的 顺序 排列 
的 ,为 此 先 从 图 G 的 邻接 矩阵 中 获取 所 有 边 集 已 ,再 采用 直接 插入 排序 法 对 边 集 已 按 权 值 
递增 排序 。 克 鲁 斯 卡尔 算法 如 下 : 


typedef struct 


{ intui // 边 的 起 始 顶点 
int v; // 边 的 终止 顶点 
int w; // 边 的 权 值 

} Edge; 

void Kruskal(MatGraph g) // Kruskal 算法 


{ inti,j,ul,vl,snl,sn2,k; 
int vsetLMAXV] ; 


Edge E[MaxSize] ; // 存 放 图 中 的 所 有 边 
k=0; //e 数 组 的 下 标 从 0 开始 计 
for (i=0;i<g.n;it+) // 由 g 产 生 边 集 E, 不 重复 选取 同一 条 边 


for (j=0;j<=i;j+ 十 ) 
if (g.edges[] 0] !=0 && g.edges[i] 0]!=INF) 
{ Ek].u=i;E[k] .v=j;E[k] .w=g.edges[i] 0]; 
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} 
InsertSort(E, g.e); // 采 用 直接 插入 排序 对 下 数组 按 权 值 递增 排序 
for (i=0;i<g.nii 十 十 ) // 初 始 化 辅助 数组 
vset[ 站 一 让 
一 二 //k 表示 当前 构造 生成 树 的 第 几 条 边 , 初 值 为 1 
j=0; //E 中 边 的 下 标 , 初 值 为 0 
while (k< g.n) // 生 成 的 边 数 小 于 n 时 循环 
{ ul=ED].u;vl=ED].v; // 取 一 条 边 的 两 个 顶点 
snl=vset[ul]; 
sn2=vset[v1] ; // 分 别 得 到 两 个 顶点 所 属 的 集合 编号 
if (snl!=sn2) // 两 顶点 属于 不 同 的 集合 ,该 边 是 最 小 生成 树 的 一 条 边 
{ printf(" (%d,%d):%d\n",ul,vl, EG].w); // 输 出 最 小 生成 树 的 一 条 边 
ki // 生 成 边 数 增 1 


for (i 二 0;i<g.n;i 二 十 ) ”// 两 个 集合 统一 编号 
让 (vset 加 = 一 sn2) ”// 集 合 编号 为 sn2 的 改 为 snl 


vset[] =snl; 


JE // 扫 描 下 一 条 边 
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如 果 给 定 的 带 权 连通 图 G 有 n 个 顶点 .e 条 边 , 在 上 述 算 法 中 ,对 边 集 巨 采用 直接 插入 
排序 的 时 间 复 杂 度 为 O(ez ) 。while 循环 是 在 e 条 边 中 选取 (n 一 1) 条 边 , 而 其 中 的 for 循环 
执行 nn 次 ,因此 while 循环 的 时 间 复 杂 度 为 O(n 十 ee )。 对 于 连通 无 向 图 ,e 宇 (n 一 1) ,那么 
用 Kruskal 算法 构造 最 小 生成 树 的 时 间 复 杂 度 为 OCe?)。 

可 以 对 前 面 的 Kruskal 算法 进行 两 方面 的 改进 ,其 一 是 将 边 集 排序 改 为 堆 排 序 ( 将 在 第 10 
章 中 介绍 ); 其 二 是 采用 第 7 章 介绍 的 并 查 集 进行 连通 分 量 合 并 , 先 通过 MAKE_SET(1,n) 进 
行 并 查 集 树 的 初始 化 , 即 每 个 顶点 作为 一 个 分 离 集合 树 (其 编号 为 该 顶点 的 编号 ) ,当选 择 一 
条 边 (u,v) 时 , 求 出 uv 顶点 所 在 分 离 集合 树 的 编号 , 若 不 同 则 将 顶点 wx 和 顶点 v 所 在 的 分 
离 集 合 树 按 秩 合 并 。 改 进 的 Kruskal 算法 如 下 : 


void Kruskal(MatGraph g) // 改 进 的 Kruskal 算法 
{ inti,j,k,ul,vl,snl, sn2; 
UFSTree t[MaxSize] ; 


Edge E[MaxSize] ; 
k=1; //e 数 组 的 下 标 从 1 开始 计 
for (i=0;i<g.n;i 十 十 ) // 由 g 产 生 的 边 集 E 


for (j=0;j<=i;j+ 十 ) 
if (g.edges[i] 0] !=0 && g.edges[i] 0]!=INF) 
{  E[k].u=i;E[k] .v=j;E[k].w=g.edges[] 0]; 


ei: 
} 
HeapSort(E, g.e); // 采 用 堆 排 序 对 下 数组 按 权 值 递增 排序 
MAKE_SETCt,g.n); // 初 始 化 并 查 集 树 t 
k=1; //k 表 示 当 前 构造 生成 树 的 第 几 条 边 , 初 值 为 1 
j=1; //E 中 边 的 下 标 从 1 开始 
while (k< g.n) // 生 成 的 边 数 小 于 n 时 循环 
{ ul=ED].u; 
vl=ED].v; // 取 一 条 边 的 头 尾 顶点 编号 ul 和 v2 
snl=FIND_SET(t, ul); 
sn2=FIND_SET(t, v1); // 分 别 得 到 两 个 顶点 所 属 的 集合 编号 
if (snl!= sn2) // 两 顶点 属于 不 同 的 集合 ,该 边 是 最 小 生成 树 的 一 条 边 
{ printf(" (%d,%d):%d\n",ul,vl, EO.w); 
et // 生 成 边 数 增 1 
UNION(t, ul,vl); // 将 ul 和 vl 两 个 顶点 合并 
} 
| // 扫 描 下 一 条 边 





} 


如 果 给 定 的 带 权 连通 图 G 有 nn 个 顶点 、e 条 边 , 上 述 改 进 的 Kruskal 算法 中 不 考虑 生成 
边 数 组 下 的 过 程 , 堆 排序 的 时 间 复 杂 度 为 O(elogse)。while 循环 是 在 。 条 边 中 选取 (n 一 1) 
条 边 , 其 中 的 UNION () 的 执行 时 间 为 O(logzn), 因 此 while 循环 的 时 间 复 杂 度 为 
O(elogzn)。 对 于 连通 无 向 图 .e 宇 n 一 1, 那 么 改进 的 Kruskal 算法 构造 最 小 生成 树 的 时 间 复 
杂 度 为 O(elogse)。 可 以 看 出 ,Kruskal 算法 的 执行 时 间 仅 与 图 中 的 边 数 有 关 , 与 项 点数 无 
关 , 所 以 它 特别 适合 用 稀疏 图 求 最 小 生成 树 。 


HR 采用 狄 克 斯 特 拉 (Dijkstra) 算 法 求解 ,其 基本 思想 是 , 设 G 一 (V,E) 是 
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【 例 8. 12〗 有 如 图 8. 32 所 示 的 一 个 带 权 连 通 图 ,在 求 其 最 小 生成 树 时 , 问 (0,2)、 
(0,3)、(1,2) 和 (2,3) 这 3 条 边 中 哪些 可 能 是 Kruskal 算法 第 2 次 选中 但 不 是 Prim 算法 (从 
3 开始 ) 第 2 次 选中 的 边 。 





在 采用 Kruskal 算法 求 最 小 生成 树 时 首先 选中 权 最 小 
的 边 (0,3) ,第 2 次 选中 时 有 3 条 边 的 权 相 同 的 次 小 边 , 可 以 从 
(0,2)、 (2,3) 和 (1,2) 边 中 任 选 一 条 。 

采用 Prim 算法 (从 3 开始 ) 求 最 小 生成 树 ,首先 U 王 13} ,第 
1 次 选中 (3,0) 边 。 修 改 U={3,0},V 一 U=={1,2}, 第 2 次 只 能 
图 8.32 一 个 带 权 连 通 图 ”在 这 两 个 顶点 集 之 间 选 中 一 条 最 小 边 ,可 以 是 边 (0,2) 或 者 
(2,3) ,不 可 能 是 边 (1,2) 。 





最 短路 径 





851 路 径 的 概念 

在 一 个 不 带 权 图 中 , 若 从 一 顶点 到 另 一 顶点 存在 着 一 条 路 径 , 则 称 该 路 
径 长 度 为 该 路 径 上 所 经 过 的 边 的 数目 , 它 等 于 该 路 径 上 的 顶点 数 减 1。 由 
于 从 一 顶点 到 另 一 顶点 可 能 存在 着 多 条 路 径 ,每 条 路 径 上 所 经 过 的 边 数 可 
能 不 同 , 即 路 径 长 度 不 同 ,把 路 径 长 度 最 短 ( 即 经 过 的 边 数 最 少 ) 的 那 条 路 径 称 为 最 短路 径 
(shortest path) ,其 长 度 称 为 最 短路 径 长 度 或 最 短 距离 。 

对 于 带 权 图 ,考虑 路 径 上 各 边 上 的 权 , 则 把 一 条 路 径 上 所 经 边 的 权 之 和 定义 为 该 路 径 的 
路 径 长 度 。 从 源 点 到 终点 可 能 有 不 止 一 条 路 径 , 把 路 径 长 度 最 小 的 那 条 路 径 称 为 最 短路 径 ， 
其 路 径 长 度 ( 权 之 和 ) 称 为 最 短路 径 长 度 。 

实际 上 ,只 要 把 不 带 权 图 上 的 每 条 边 看 成 是 权 值 为 1 的 边 , 那 么 不 带 权 图 和 带 权 图 的 最 
短路 径 和 最 短 距 离 的 定义 就 一 致 了 。 

求 图 的 最 短路 径 有 两 个 方面 的 问题 , 即 求 图 中 某 一 顶点 到 其 余 各 顶点 的 最 短路 径 和 求 
图 中 每 一 对 顶点 之 间 的 最 短路 径 。 


852 从 一 个 顶点 到 其 余 各 顶点 的 最 短路 径 


问题 : 给 定 一 个 带 权 有 向 图 G 与 源 点 v, 求 从 源 点 wv 到 G 中 其 他 顶点 的 最 短路 径 , 并 限 
定 各 边 上 的 权 值 大 于 0。 




















一 个 带 权 有 向 图 ,把 图 中 的 顶点 集合 V 分 成 两 组 ,第 1 组 为 已 求 出 最 短路 径 
的 顶点 集合 (用 S 表示 ,初始 时 S 中 只 有 一 个 源 点 ,以 后 每 求 得 一 条 最 短路 
径 v、…、u， 就 将 顶点 w 加 入 到 集合 S 中 ,直到 全 部 顶点 都 加 入 到 S 中 ,算法 
就 结束 了 ) ,第 2 组 为 其 余 未 确定 最 短路 径 的 顶点 集合 (用 U 表示 ) , 按 最 短 
路 径 长 度 的 递增 次 序 依次 把 第 2 组 的 顶点 加 入 S 中 。 
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计算 机 科学 家 简介 

Edsger Wybe Dijkstra(1930 年 一 2002 年 ) ,荷兰 计算 机 科学 家 ， 
毕业 就 职 于 荷兰 莱 顿 大 学 ,早年 钻研 物理 及 数学 ,而 后 转 为 计算 学 。 
于 1972 年 获得 计算 机 科学 界 最 高 奖 一 一 图 灵 奖 ,还 获得 过 1974 年 
AFIPS Harry Goode Memorial Award、1989 年 ACM SIGCSE 计算 机 科 
学 教育 教学 杰出 贡献 奖 ,以 及 2002 年 ACM PODC 最 具 影 响 力 论 
文 奖 。 

他 曾经 提出 “GOTO 有 害 论 ”信号 量 和 PV 原 语 ,解决 了 有 趣 的 
“哲学 家 就 餐 问题 ”, 提 出 了 目前 应 用 广泛 的 最 短路 径 算 法 。 





























Dijkstra 算法 的 具体 步骤 如 下 : 





(1) 初始 时 S 只 包含 源 点 , 即 S=={v) , 源 点 v 到 自己 的 距离 为 0。U 包含 除 源 点 v 以 外 
的 其 他 顶点 , 源 点 wv 到 UU 中 任 一 顶点 i 的 最 短路 径 长 度 为 边 上 的 权 ( 车 源 点 v 吕 i 有 边 
<v,i>) 或 co( 着 源 点 vi 没有 边 )。 

(2) 从 UU 中 选取 一 个 顶点 ,使 源 点 vu 的 最 短路 径 长 度 为 最 小 ,然后 把 顶点 加 入 
S 中 。 

(3) 以 顶点 为 新 考虑 的 中 间 点 ,修改 源 点 v 到 UU ,的 最 类 中 
中 所 有 顶点 的 最 短路 径 长 度 , 称 之 为 路 径 调整 ,其 过 程 ” 径 ， 长度 为 cv- 
如 图 8. 33 所 示 ( 图 中 顶点 之 间 的 实 线 箭头 表示 边 ,虚线 
箭头 表示 路 径 ) ,对 于 U 中 的 某 个 顶点 j, 在 没有 考虑 中 ©) _ 
间 点 wx 时 ,假设 求 得 从 源 点 vc 的 一 条 最 短路 径 为 vcj 的 最 短路 径 ， 长 度 为 cy 
(asj) ,其 最 短路 径 长 度 为 cw (如 果 没 有 这 样 的 最 。 图 8.33 从 源 点 v 到 顶点 j 的 
短路 径 ,cu 二 吕 ), 而 从 源 点 vu 的 一 条 最 短路 径 为 路 径 比较 


(oa) ,其 最 短路 径 长 度 为 cu。 现在 考虑 中 间 点 w， 
假设 从 源 点 vs) 存在 另 一 条 经 过 顶点 x 的 路 径 ( 其 中 顶点 到 顶点 j 有 一 条 边 ) ,其 路 径 长 
度 为 cu 十 zw 。 这 样 在 考虑 中 间 点 wx 以 后 ,从 源 点 vcj 有 两 条 路 径 ， 

。 经 过 顶点 zx 的 路 径 ,路 径 长 度 为 cw 十 zeow 。 

。 不 经 过 顶点 x 的 原来 的 最 短路 径 , 路 径 长 度 为 cv 。 

显然 ,在 考虑 中 间 点 “以 后 ,从 源 点 vs) 的 最 短路 径 是 上 述 两 条 路 径 中 的 较 短 者 。 也 
就 是 说 , 源 点 vc) 的 最 短路 径 长 度 调整 为 MIN{c 十 ww ,cw }。 

(4) 重复 步骤 (2) 和 (3) ,直到 S 包含 所 有 的 顶点 。 

和 求 最 小 生成 树 的 算法 一 样 ,Dijkstra 算法 中 需要 频繁 地 取 一 条 条 边 及 其 权 值 ,所 以 图 
采用 邻接 矩阵 更 合适 。 用 一 个 一 维 数组 dist 存放 最 短路 径 长 度 , 如 dist[ 门 表示 源 点 v 咏 j 
的 最 短路 径 长 度 ,其 中 源 点 wv 是 默认 的 ,那么 如 何 存放 最 短路 径 呢 ? 

从 源 点 v 到 其 他 顶点 的 最 短路 径 有 nn 一 1 条 ,一 条 最 短路 径 用 一 个 一 维 数组 表示 ,例如 
从 源 点 0 吃 5 的 最 短路 径 为 0、2、3、5 ,表示 为 path[5] 二 10,2,3,5)}。 所 有 n 一 1 条 最 短路 径 
可 以 用 二 维 数组 path 存储 。 但 这 里 是 用 一 个 一 维 数组 path 来 存储 n 一 1 条 最 短路 径 的 ,这 
样 是 如 何 实现 的 呢 ? 先 看 以 下 命题 。 
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命题 : 若 从 源 点 到 某 个 顶点 j 的 最 短路 径 是 (v,…,a,…,u,j) ,也 就 是 说 ,在 源 点 vc 
j 的 最 短路 径 上 顶点 j 的 前 一 个 顶点 是 ,那么 其 中 的 (v,… ,a,…,w) 一 定 是 源 点 vou 的 最 
短路 径 。 

这 个 命题 可 以 采用 反 证 法 证 明 ,假设 (v,…,a,…,u, 站 是 源 点 v 到 顶点 j 的 最 短路 径 ， 
但 (v,…,a,…,w) 不 是 源 点 vOw 的 最 短路 径 。 由 于 (v,…,a,…,w) 不 是 源 点 vu 的 最 短 
路 径 , 设 源 点 vw 的 最 短路 径 为 (v,… ,5,…,u) ,如 图 8.34 所 示 , 则 (v,… ,56,…,u,j) 是 一 
条 比 (v,… ,a,…,u,j) 更 短 的 新 路 径 , 与 前 面 的 假设 矛盾 ,命题 得 证 。 

借助 上 述 命题 ,用 path[j] 存 放 源 点 vj 的 最 短路 径 上 顶点 j 的 前 一 个 顶点 编号 ,其 中 
源 点 vv 是 默认 的 。 例 如 从 源 点 0 全 5 的 最 短路 径 为 0.2、3、5, 则 最 短路 径 表 示 为 path[5] 二 3， 
path[3] 二 2,path[2] 二 0。 当 path 求 出 后 ,通过 反 推 求 出 从 源 点 到 每 一 个 顶点 的 最 短路 径 。 

再 看 一 下 图 8. 33, 求 源 点 v 全 ) 最 短路 径 时 ,不 经 过 顶点 wx 的 原来 的 最 短路 径 表 示 为 
path[L 门 二 ay， 而 经 过 顶点 x 的 路 径 若 是 最 短路 径 , 该 路 径 表 示 为 path[j] 二 w。 所 以 ,在 考虑 
中 间 点 4 以 后 ,dist[ 站 二 MIN{dist[u] 十 row ,dist[j]) ,车 经 过 顶点 的 路 径 更 短 , 修 改 
path[ 站 二 ,否则 不 修改 path[j]。 

例如 ,对 如 图 8. 35 所 示 的 带 权 有 向 图 采用 Dijkstra 算法 求 从 顶点 0 到 其 他 顶点 的 最 短 
路 径 , 并 说 明 整 个 计算 过 程 。 





AF: 
图 8.34 反 证 法 示意 图 图 8.35 一 个 带 权 有 向 图 
(1) 初始 化 : S={0},U={1,2,3,4,5,6} ,dist[ ]= 二 {0,4,6,6,co ,co ,co0}( 源 点 0 到 其 他 


各 顶点 的 权 值 ,直接 来 源 于 邻接 矩阵 ) ,path[ ] 二 {0.0,0,0, 一 1, 一 1, 一 1) (车 源 点 0 到 顶点 i 
有 边 <0,i>, 它 就 是 当前 从 源 点 0 Si 的 最 短路 径 , 且 最 短路 径 上 顶点 i 的 前 一 个 顶点 是 源 
点 0, 即 置 path[ 门 =0; 和 否则 置 path[ 门 = 一 1, 表 示 源 点 0 到 顶点 i 没有 路 径 )。 

(2) 从 口中 找 最 小 的 顶点 ( 即 dist 值 最 小 的 顶点 ) 为 顶点 1, 将 它 添加 到 S 中 ,S= 
{0,1},U 二 {2,3,4,5,6} ,考查 顶点 1, 发 现 从 顶点 1 到 顶点 2 和 4 有 边 : 

dist[2] 王 MIN{dist[L2],distL1] 十 1} 一 5( 修 改 ) 

dist[4] 王 MIN{dist[L4] ,distL1] 十 7} 一 11( 修 改 ) 
则 dist[L]={0,4,5,6,11,co,co}) ,在 path 中 用 顶点 1 代替 dist 值 发 生 修改 的 顶点 ,path[ ] 一 
{0,0,1,0,1，, 一 1, 一 1)。 

(3) 从 U 中 找 最 小 的 顶点 为 顶点 2, 将 它 添加 到 S 中 ,S={0,1,2},U 一 {3,4,5,6}, 考 
查 顶 点 2 ,发 现 从 顶点 2 到 顶点 4 和 5 有 边 : 

dist[4]=MIN{dist[4], dist[2]+6}=11 

dist[5] 二 MIN{dist[5],dist[2] 十 4} 二 9( 修 改 ) 
则 dist[] 二 {0,4,5,6,11,9,5°} ,在 path 中 用 顶点 2 代替 dist 值 发 生 修 改 的 顶点 ,path[ ] 二 
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003085 2 二 示 : 

(4) 从 口中 找 最 小 的 顶点 为 顶点 3, 将 它 添 加 到 S 中 ,S={0,1,2,3),U 一 (4,5,6)}，, 考 
查 顶 点 3, 发 现 从 顶点 3 到 顶点 2 和 5 有 边 ,由 于 顶点 2 已 经 考查 过 ,不 进行 修改 : 

distL5] 王 MIN{distL5],dist[3] 十 5} 一 9 

没有 修改 ,dist 和 path 不 变 。 

(5) 从 U 中 找 最 小 的 顶点 为 顶点 5, 将 它 添加 到 S 中 ,S=={0,1,2,3,5},U 二 {4,6), 考 
查 顶 点 5 ,发现 从 顶点 5 到 达 顶 点 4 和 6 有 边 : 

dist[4] 二 MIN{dist[4],dist[5] 十 1} = 二 10( 修 改 ) 

dist[6] 二 MIN{dist[6],dist[5] 十 8) 二 17( 修 改 ) 
则 dist[]=={0,4,5,6,10,9,17) ,在 path 中 用 顶点 5 代替 dist 值 发 生 修 改 的 顶点 ,path[ ]= 
(00017055 2 8} 

(6) 从 器 中 找 最 小 的 顶点 为 顶点 4, 将 它 添加 到 S 中 ,S={0,1,2,3,5,4),U 二 16), 考 
查 顶 点 4, 发 现 从 顶点 4 到 达 顶 点 6 有 边 : 

dist[6] 二 MIN{dist[6],dist[4] 十 6) 二 16( 修 改 ) 
则 dist[ 二 {0,4,5,6,10,9,16) ,在 path 中 用 顶点 4 代替 dist 值 发 生 修 改 的 顶点 ,path[ ]= 
{0;0v150555254y 

(7) 从 U 中 找 最 小 的 顶点 为 顶点 6, 将 它 添加 到 S 中 ,S={0,1,2,3,5,4,6},U 二 {), 从 
顶点 6 不 能 到 达 任 何 顶点 。S 中 包含 所 有 顶点 ,过 程 结束 ,此 时 dist[ ] 二 10,4,5,6,10,9， 
16} ,path[ ] 二 {0,0,1,0,5,2,4)}。 上 述 过 程 如 图 8. 36 所 示 。 

(8) 输出 最 短路 径 ,这 里 以 源 点 0 只 6 的 最 短路 径 进 行 说 明 ,distL6] 王 16, 即 该 最 短路 径 
长 度 为 16。path[6] 二 4,path[4] 二 5,path[5j 二 2,path[2] 二 1,path[1]==0, 反 推出 最 短路 
径 为 0 一 1 一 2 一 5 一 4-~6。 

从 源 点 到 所 有 其 他 项 点 的 求解 结果 如 下 : 











从 顶点 0 到 顶点 1 的 路 径 长 度 为 :4 路 径 为 : 0,1 

从 顶点 0 到 顶点 2 的 路 径 长 度 为 :5 路 径 为 : 0,1,2 

从 顶点 0 到 顶点 3 的 路 径 长 度 为 :6 路径 为 : 0,3 

从 顶点 0 到 顶点 4 的 路 径 长 度 为 :10 路 径 为 : 0,1,2,5,4 
从 顶点 0 到 顶点 5 的 路 径 长 度 为 :9 路 径 为 : 0,1,2,5 

从 顶点 0 到 顶点 6 的 路 径 长 度 为 :16 路 径 为 : 0,1,2,5,4,6 


从 以 上 过 程 可 以 看 出 ,Dijkstra 算法 具有 以 下 特点 : 
(1) 在 执行 中 ,一 个 顶点 一 旦 添加 到 S 中 后 ,其 最 短路 径 长 度 不 再 改变 。 





(2) 正 是 由 于 具有 特点 (1) ,所 以 Dijkstra 算法 不 适合 含有 负 权 值 的 带 权 图 求 单 源 最 短路 se 


径 。 通 过 一 个 反例 说 明 ,假设 一 个 含有 3 个 顶点 的 带 权 有 向 图 ,< 0,1 > 的 权 值 为 1,<0,2> 
的 权 值 为 2,<2,1 > 的 权 值 为 一 3, 如 图 8. 37 所 示 。 若 源 点 为 0, 在 执行 Dijkstra 算法 时 首先 
选取 的 中 间 点 为 1, 求 出 源 点 0 到 顶点 1 的 最 短路 径 长 度 为 1, 以 后 不 再 改变 。 而 实际 上 ， 
0 一 2 一 1 才 是 源 点 0 到 顶点 1 的 最 短路 径 , 其 长 度 为 一 1。 

(3) 按 顶 点 进入 S 的 先后 顺序 最 短路 径 长 度 越 来 越 长 ,例如 图 8. 35 所 示 的 各 最 短路 径 
的 情况 如 图 8. 38 所 示 。 
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dist path 
5 人 01234556 01234556 
{0} {1, 2, 3, 4, 5, 6} 0466%mmm 0000-1-1-l 
UL 
最 小 路 径 长 度 的 项 点 : 1 
01234556 01234556 
{0, 1} pe 04 四 5 加 = > 0 0 加。 四-!- 
TL 
最 小 路 径 长 度 的 项 点 : 2 
O23456 01234556 
{0, 1, 2} {3, 4, 5, 6} o04561B* 00101 上 日 -1 
I 
最 小 路 径 长 度 的 顶点 : 3 
01234556 01234556 
1 {4, 5, 6} 0456119% 00101271 
最 小 路 径 长 度 的 项 点: 5 
01234556 01234556 
10, 1 2 3, 身 {4, 6} 0456 四 ? 面 0010 目 ?日 
一 0 一 
最 小 路 径 长 度 的 顶点 : 4 
01234556 01234556 
{0, 1, 2, 3, 5, 4} {6} 0456109 国 001052 上 日 
于 
最 小 路 径 长 度 的 顶点 : 6 
01234556 01234556 
{0, 1, 2, 3, 5, 4, 6} 全 045610916 0010524 
图 8.36 ”Dijkstra 算法 的 求解 过 程 
下 标 :0 1 2 3 4 5 6 
S={0, 1, 2, 3, 5, 4, 6} 
+1 
5 
6 9 
10 16 
递增 
图 8.37 一 个 带 权 有 向 图 图 8.38 源 点 到 各 个 顶点 的 最 短路 径 长 度 是 递增 的 
对 应 的 Dijkstra 算法 如 下 (w 为 源 点 ): 
void Dijkstra(MatGraph g, int v) //Dijkstra 算法 
{ intdist[MAXV],path[MAXV]; 
int SIMAXV]; //S 中 =1 表示 顶点 i 在 S 中 ,SD==0 表示 顶点 i 在 U 中 


int MINdis,i,j, u; 

for (i 王 0;i<g.nii 十 十 ) 

{ dist[]=g.edges[v][]; // 距 离 初始 化 
S[]=0; //SD 置 空 
if (g.edges[v] [<INF) // 路 径 初 始 化 
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path[i] =v; // 顶 点 v 到 顶点 i 有 边 时 ,置顶 点 i 的 前 一 个 顶点 为 v 
else 
path[i] =—1; // 顶 点 v 到 顶点 i 没 边 时 ,置顶 点 i 的 前 一 个 顶点 为 一 1 
} 
S[v] =1;path[v] =0; // 源 点 编号 v 放 入 S 中 
for (i=0;i<g.n—1;i++) // 循 环 直到 所 有 项 点 的 最 短路 径 都 求 出 
{ MINdis=INF:; //MINdis 置 最 大 长 度 初 值 


for (j=0;j<g.n;j+ 十 ) // 选 取 不 在 S 中 ( 即 U 中 ) 且 具有 最 小 最 短路 径 长 度 的 顶点 u 
if (SG]==0 && dist[]< MINdis) 
Col 
MINdis=dist0] ; 
} 
S[uj=1; // 顶 点 u 加 入 S 中 
for (j 一 0;j<g.nij 十 十 ) // 修 改 不 在 S 中 ( 即 U 中 ) 的 顶点 的 最 短路 径 
if (SD]==0) 
if (g.edges[u] D]<INF && dist[ 加 十 g.edges[ 由 中 < dist0]) 
{ distD]=dist[u]+g.edges[u] [0]; 
path0] =u; 
| 
} 
Dispath(g, dist, path, S, v) ; // 输 出 最 短路 径 
} 


输出 单 源 最 短路 径 的 Dispath() 函数 如 下 : 


void Dispath( MatGraph g, int dist[] ,int path[] ,int SOD] ,int v) 


// 输 出 从 顶点 v 出 发 的 所 有 最 短路 径 

{ inti,j,k; 
int apathLMAXV] , d; // 存 放 一 条 最 短路 径 ( 逆 向 ) 及 其 顶点 个 数 
for (i=0;i<g.n;i+t 十 ) // 循 环 输出 从 顶点 v 到 i 的 路 径 


if (S[]==1 && il=v) 
{ printf(" 从 顶点 %d 到 顶点 %d 的 路 径 长 度 为 :%d\t 路 径 为 :",v,i, dist[); 


d=0; apath[d] =i; // 添 加 路 径 上 的 终点 

k=path[] ; 

Mem // 没 有 路 径 的 情况 
printf(" 无 路 径 \n"); 

else // 存 在 路 径 时 输出 该 路 径 


{ while (k!=v) 
{ d++; apath[d]=k; 


k= path[k] ; 
} 
d 十 十 ; apath[d]=v; // 添 加 路 径 上 的 起 点 
printf("%d" ,apath[d] ); // 先 输出 起 点 


for (j=d—1;j>=0;j 一 一 ) // 再 输出 其 他 项 点 
printf(", %d" ,apathD]); 
printf("\n"); 


} 


不 考虑 路 径 的 输出 ,Dijkstra 算法 的 时 间 复 杂 度 为 O(n?) ,其 中 双 为 图 中 顶点 的 个 数 。 
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【 例 8. 13〗 有 人 这 样 修改 Dijkstra 算法 ,假设 源 点 为 v, 每 次 从 U 中 选取 非 == 的 距离 最 


大 的 顶点 x 添加 到 S 集合 中 ,然后 以 为 新 考虑 的 中 间 点 ,修改 源 点 v 到 UU 中 各 项 点 的 距 
离 ,调整 为 非 ° 的 最 大 距离 ,重复 上 述 过 程 直到 S 包含 所 有 的 顶点 。 问 这 样 修改 后 的 算法 
能 否 求 出 源 点 v 到 图 中 其 他 顶点 的 最 长 路 径 ? 

不 一 定 。 下 面 通过 一 个 反例 说 明 。 

例如 ,对 于 图 8. 35 所 示 的 带 权 有 向 图 ,假设 源 点 wv 为 0。 按照 上 述 修 改 后 的 Dijkstra 算 
法 ,求解 过 程 如 下 : 


(1) S=={0}) ,U0 二 {1,2,3,4,5,6}, 源 点 vw 到 1~6 各 顶点 的 距离 dist={0,4,6,6,co,co， 
ce)。 从 U 中 选取 非 == 的 距离 最 大 的 顶点 为 2。 

(2) S 二 {0,2) ,0 二 {1,3,4,5,6) ,顶点 2 到 顶点 4、5 有 边 , 所 以 调整 顶点 4 的 最 大 距离 
为 12 ,调整 顶点 5 的 最 大 距离 为 10, 即 dist={0,4,6,6,12,10,=<c}。 从 U 中 选取 非 cc 的 距 
离 最 大 的 顶点 为 4。 

(3) S 二 {0,2,4} ,0 二 {1,3,5,6), 顶 点 4 到 顶点 6 有 边 , 所 以 调整 顶点 6 的 最 大 距离 为 
18, 即 dist 二 {0,4,6,6,12,10,18)}。 从 UU 中 选取 非 吕 的 距离 最 大 的 顶点 为 6。 

(4) S 二 {0,2,4,6),U 二 {1,3,5) ,图 中 没有 从 顶点 6 出 发 的 边 , 不 调整 。 由 于 顶点 6 已 
添加 到 S 中 ,以 后 不 会 再 调整 ,也 就 是 说 源 点 0 到 顶点 6 的 最 长 路 径 长 度 为 18。 而 实际 上 ， 
0 一 3 一 5 一 6 才 是 源 点 0 中 6 的 最 长 路 径 , 其 长 度 为 19。 

这 样 反 证 了 上 述 修 改 后 的 Dijkstra 算法 用 于 求 源 点 v 到 图 中 其 他 顶点 的 最 长 路 径 不 一 
定 是 可 行 的 。 

853 每 对 顶点 之 间 的 最 短路 径 

问题 : 对 于 一 个 各 边 权 值 均 大 于 零 的 有 向 图 ,对 每 一 对 顶点 i 隆 j, 求 出 顶点 i 与 顶点 j 

之 间 的 最 短路 径 和 最 短路 径 长 度 。 


可 以 通过 以 每 个 顶点 作为 源 点 循环 求 出 每 对 顶点 之 间 的 最 短路 径 。 除 此 之 外 , 弗 洛 伊 
德 (Floyd) 算 法 也 可 用 于 求 两 顶点 之 间 的 最 短路 径 。 


计算 机 科学 家 简介 


Robert W Floyd(1936 一 2001 年 ) ,他 从 小 就 被 视 为 神童 ,年 仅 
17 岁 就 获得 芝加哥 大 学 文学 学 士 学 位 ,22 岁 获得 物 扫 -- 扫 
理学 第 二 个 学 士 学 位 。 他 27 岁 被 CMU 聘请 为 副 教 
授 一 职 ,6 年 后 ,获得 了 斯 坦 福 大 学 的 终身 教授 的 职 
务 , 在 斯 坦 福 大 学 ,他 与 Knuth 成 为 同事 和 亲密 的 朋 
友 。 他 是 检验 系统 方法 论 的 开创 者 ,在 词法 分 析 理 
论 、 编 程 语言 语义 自动 程 序 验证 .自动 程序 综合 生成 和 算法 分 析 等 方面 做 
出 杰出 贡献 ,于 1978 年 获得 计算 机 科学 界 最 高 奖 一 一 图 灵 奖 。 


























假设 有 向 图 G 二 (V,E) 采 用 邻接 矩阵 g 表示 ,另外 设置 一 个 二 维 数组 A 用 于 存放 当前 
顶点 之 间 的 最 短路 径 长 度 , 即 分 量 A[ 引 [j] 表 示 当 前 i 3j 的 最 短路 径 长 度 。Floyd 算法 的 
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基本 思想 是 递 推 产生 一 个 矩阵 序列 Ao ,4 ,… ,A ,…,A,-1, 其 中 A,[ 门 [ 门 表示 i 咏 j 的 路 径 
上 所 经 过 的 顶点 编号 不 大 于 k 的 最 短路 径 长 度 。 

初始 时 有 A-1[ 门 [j] 二 g. edges[i[j]。 若 Ai-1[ 让 [j] 已 求 出 ,现在 考查 顶点 上 , 求 i 3j 
的 路 径 上 所 经 过 的 顶点 编号 不 大 于 A 的 最 短路 径 长 度 4x[ 训 [7 门 ,此 时 is 的 路 径 有 两 条 。 

路 径 1: 在 考查 顶点 之 前 求 出 其 最 短路 径 长 度 为 4-_1[i[j] (车 没有 这 样 的 路 径 ， 
A4-1[ij[jj 取 值 为 oo)。 

路 径 2: 考查 顶点 &,ic2j 存在 一 条 经 过 顶点 & 有 _ 条 路 径 ， 
的 路 径 , 如 图 8. 39 所 示 ,该 路 径 分 为 两 段 , 即 i 咏 k 44 
和 kj ,其 长 度 为 Ai-1[ 门 [Rj] 十 A4-1[kJ[7] (车 没 






有 这 样 的 路 径 , 该 长 度 取 值 为 oo)。 
显然 ,如 果 路 径 2 的 长 度 更 短 , 即 A4 -1 [站 [kj 十 ee 
4k-i[A][ 门 <A4-;[ 襄 [ 门 , 则 取经 过 顶点 & 的 路 径 有 一 条 路 径 : AI 
为 新 的 最 短路 径 。 图 8.39 Floyd 算法 中 路 径 长 度 的 
归纳 起 来 ,Floyd 算法 思想 的 描述 如 下 : 调整 情况 


A-i[i][Lj] = g. edges[i]J[j] 
Ai [LiL;] = MIN( A LiLj],Ai-i [LiLk] 十 A-1[LkJL] } 0O<k<n—1 
上 式 是 一 个 选 代表 达 式 ,每 迭代 一 次 ,cj 的 最 短路 径 上 就 多 考虑 了 一 个 顶点 ; 经 过 n 
次 迭代 后 所 得 的 A,-1[ 门 [站 ] 值 就 是 考虑 所 有 顶点 后 ic) 的 最 短路 径 , 也 就 是 最 终 解 。 
另外 用 二 维 数组 path 保存 最 短路 径 , 它 与 当前 迭代 的 次 数 有 关 。path[ 门 [站 存放 着 考 
查 顶 点 0、1、…、k 之 后 得 到 的 i 中 j 的 最 短路 径 中 顶点 j 的 前 一 个 顶点 编号 ,这 和 Dijkstra 
算法 中 采用 的 方式 相似 。 
初始 时 尚未 考查 任何 顶点 ,车 i53j 有 边 <i,j >, 将 该 边 看 成 是 ic>7 的 最 短路 径 ,该 路 径 
上 顶点 j 的 前 一 个 顶点 是 i, 所 以 置 path-i [让 [7 门 = 让 否则 path- [让 [7 门 二 一 1( 表 示 无 
路 径 ) 。 
在 考查 顶点 & 之 前 ,ci 的 最 短路 径 是 (i,… ,07 , 即 paths1[ 门 [ 门 =6; Ac) 的 最 短 
路 径 是 (k,…,a,j), 即 pathe_i[A][ 门 =a。 
考虑 顶点 & 的 调整 情况 如 图 8. 40 所 示 ( 图 中 虚线 箭头 表示 路 径 , 实 线 箭头 表示 边 ) : 若 
经 过 顶点 & 的 路 径 较 长 , 则 A4[ 亲 [站 二 A4-1[ 站 [站 ,不 需要 修改 路 径 ; 若 经 过 顶点 & 的 路 径 较 
短 , 则 需要 修改 最 短路 径 和 路 径 长 度 ,Ai[i[j] 二 Ai-1[i[kj] 十 A-1[kj[j],pathi[ij[jj 二 
a=paths -1[LkJLj]。 
在 算法 结束 时 ,由 二 维 数组 path 的 值 追溯 ,可 以 得 到 从 i i 的 最 短路 径 。 


有 一 条 路 径 : 
4-[[ 各 












pathie_ [i]U]=b, pathii[A]U]=a, 
车 Ax]D]>Ai +A [A], 


GY et pathi[i] [0]=a=pathi_ 1 
EE A 


有 一 条 路 径 : 44 可 [] 
图 8. 40 Floyd 算法 中 路 径 的 调整 情况 
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co 7 
本 .区 
0 2 
co co 1 0 
采用 Floyd 算法 求解 的 过 程 如 下 : 图 8.41 一 个 有 带 权 向 图 
(1) 初始 时 有 : 
0 5 co 7 =¥ 0O=L 0 
co 0 4 2 三 二 .ET 下 
3 3 
co ce 1 0 二 是 二 六 


(2) 考虑 顶点 0,Ao[ 门 [站 表示 由 顶点 i Sj 经 由 顶点 0 的 最 短路 径 长 度 , 经 过 比较 , 没 
在 任何 路 径 上 得 到 修改 (例如 ,2 只 1 的 路 径 长 度 为 3, 尽 管 存在 2>0 一 1 的 新 路 径 , 但 其 长 度 


为 8, 大 于 原来 路 径 的 长 度 ) ,因此 有 : 
0 5 ceo 7 二 4， 人 
A ee 二 直人 直列 
3 8 2 2 2=1 2 
co co 1 0 = 二 


(3) 考虑 顶点 1,032 由 原来 没有 路 径 变 为 0 习 1 一 2, 其 长 度 为 9, 所 以 A1L0][2] 修 改 为 
9,path [0][2] 由 一 1 修改 为 1。 其 他 最 短路 径 无 变化 。 因 此 有 : 


,| 三 二 0 1 0 

co 0 4 2 = 上 = 1 i 
A = ， path = 

3 3 02 2 -| 2 

co co 1 0 一 业 一 贡 3 一 


(4) 考虑 顶点 2,1 呈 0 由 原来 没有 路 径 变 为 1-~2->0, 其 长 度 为 7, 所 以 4:[1][0] 修 改 为 
7,pathz[1][0] 由 一 1 修改 为 2; 3 只 0 由 原来 没有 路 径 变 为 3 一 2 一 0, 其 长 度 为 4, 所 以 
4s[3][0] 修 改 为 4,paths[3][0] 由 一 1 修改 为 2; 3 Sl1 由 原来 没有 路 径 变 为 3 一 2 一 1 ,其 长 
度 为 4, 所 以 4:[3][L1] 修 改 为 4,pathsL3][L1] 由 一 1 修改 为 2; 其 他 无 修改 。 因 此 有 : 


0597 Es 
7042 六 si 证 
4 3 3 0 2 Ph 2 = 2 
4410 2 名 


(5) 考虑 顶点 3,0 中 2 原来 的 最 短路 径 长 度 为 9, 路径 为 0 一 1 一 2, 现 有 一 条 更 短 的 路 径 
0 一 3 一 2, 其 长 度 为 8, 所 以 4:[0][2] 修 改 为 8,paths[0][2] 修 改 为 3; 1 号 0 原来 的 最 短路 径 
长 度 为 7, 路 径 为 1 一 2 一 0, 现 有 一 条 更 短 的 路 径 1 一 3 一 2 一 0, 其 长 度 为 6, 所 以 4:[1][0] 修 
改 为 6,paths[1]L0] 修 改 为 2; 1 32 原来 的 最 短路 径 长 度 为 4, 路径 为 1~2, 现 有 一 条 更 短 
的 路 径 1 一 3 一 2, 其 长 度 为 3, 所 以 4:[1][2] 修 改 为 3,paths[1][2] 修 改 为 3; 其 他 无 修改 。 
因此 有 : 
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因此 ,最 后 求 得 的 各 顶点 最 短路 径 长 度 和 矩阵 4 为: 
0587 
6 032 
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和 相让 


求 得 的 各 顶点 最 短路 径 矩 阵 path 为 : 
1 0 3 0 
2—1 3 1 
2 2—1 2 
2 2 3 一 1 
在 得 到 最 终 的 4 和 path 以 后 ,由 A 数组 可 以 直接 得 到 两 个 顶点 之 间 的 最 短路 径 长 度 ， 
如 A[1J[0]=6, 说 明 顶 点 1 到 0 的 最 短路 径 长 度 为 6。 
由 path 数组 可 以 推导 出 所 有 顶点 之 间 的 最 短路 径 , 其 中 第 i(0 志 i<n 一 1) 行 用 于 推导 
顶点 i 到 其 他 各 顶点 的 最 短路 径 。 下 面 以 求 1 30 的 最 短路 径 为 例 说 明 求 路 径 的 过 程 。 
path[L1][0] 王 2, 说 明 顶 点 0 的 前 一 顶点 是 顶点 2,path[1][2]==3, 表 示 顶 点 2 的 前 一 个 
顶点 是 顶点 3,path[1J[3] 二 1, 表 示 顶 点 3 的 前 一 个 顶点 是 顶点 1, 找 到 起 点 。 依 次 得 到 的 
顶点 序列 为 0.2、3、1, 则 130 的 最 短路 径 为 1 一 3 一 2 一 0。 
图 8. 41 采用 Floyd 算法 求 出 的 最 终结 果 如 图 8. 42 所 示 。 
































A(0) : path(0) : 
0 5 m 7 -l 0 -1 0 
从 0 到 1 路 径 为 : 0,1 路 径 长 度 为 : 5 ~ 0 4 2 ll sl tT 
从 0 到 2 路 径 为 : 03.2 ”路 径 长 度 为 : 8 3 2 
a oa ww wm 1 0 -l -1 3 -I 
从 0 到 3 路 径 为 : 03 路 径 长 度 为 : A(D); path(1) : 
从 1 到 0 路 径 为 : 1,3,2,0 路径 长 度 为 : 6 有 有 ,和 -1 0 1 0 
从 1 到 2 路 径 为 : 13,2 ”路 径 长 度 为 : 3 ~ 0 4 2 = 1 
从 1 到 3 路 径 为 : 1,3 ”路径 长 度 为 : 2 0 站 
人 2 i wm m 1 0 -1 -1 3-l 
从 2 到 0 路 径 为 : 2 路 径 长 度 为 : AO)， path(2) 
从 2 到 1 路 径 为 : 2,1 路 径 长 度 为 : 3 0 5 9 7 -1 0 1 0 
从 2 到 3 路 径 为 : 2,3 路 径 长 度 为 : 2 了 0 他. :< 了 人、 
从 3 到 0 路 径 为 : 3,2.0 路 径 长 度 为 : 4 1 2 3 e I 
从 3 到 1 路 径 为 : 32.1 ” 路径 长 度 为 : 4 AG)， path(3) 
从 3 到 2 路 径 为 : 3,2 路 径 长 度 为 : 1 4 8 了 -10 3 0 
6 0 3 2 2 -1 3 -l 
3 总 汀 过 人 
4 4 1 0 2 2 3 -I 
(a) 最 短路 径 长 度 (b) 最 短路 径 


8.42 采用 弗 洛 伊 德 算法 求 出 的 结果 和 求解 过 程 
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对 应 的 Floyd 算法 如 下 : 


void Floyd(MatGraph g) //Floyd 算法 
{ int A[MAXV][MAXV],path[MAXV][MAXV]; 
int i,j, k; 


for (i=0;i<g.n;i++) 
for (j=0;j<g.n;j+t 十 ) 
{ A[i0G]=g.edges[i] 0]; 
让 (il 一 j && g.edges[] DJ<INF) 


path[] 0] =i; // 顶 点 i 到 ;有 边 时 
else 
path[J0]=—1; // 顶 点 i 到 j 没有 边 时 
} 
for (k=0;k<g.nik 十 十 ) // 依 次 考查 所 有 顶点 


{ for (i=0;i<g.n;i+ 十 ) 
{for (je0j<gndj 汪 十} 
if (A[I OJ> A Ck]+ACk]O]) 
{ ”A 四 中 =A[J[kJ 十 A[kj 中 ]; // 修 改 最 短路 径 长 度 
path[i] 0] =path[k] 0]; // 修 改 最 短路 径 
} 
} 
Dispath(g, A, path); // 输 出 最 短路 径 
} 


输出 多 源 最 短路 径 的 Dispath() 函数 如 下 : 


void Dispath( MatGraph g,int A[] [MAXV] ,int path[] [MAXV]) 
{ inti,j,k,s; 
int apathLMAXV] ,d; // 存 放 一 条 最 短路 径 中 间 顶 点 ( 反 向 ) 及 其 顶点 个 数 
for (i=0;i<g.n;i+ 十 ) 
for (j=0;j<g.n;j 十 十 ) 
{ if (A[IO!=INF && il 一 ji) // 若 顶点 1 和 j 之 间 存 在 路 径 
{ printf(" 从 %d 到 %d 的 路 径 为 :",i,j); 
k=path[] 0] ; 
d=0; apath[d] =j; // 路 径 上 添加 终点 
while (k! 一 一 1 && k!=i) ”// 路 径 上 添加 中 间 点 
{ d+ 二 +; apath[d]=k; 
k= path[] [k]; 
} 
d 十 十 ; apath[d] =i; // 路 径 上 添加 起 点 
Printf("%d",apath[d]); // 输 出 起 点 





ER for (s==d 一 1;s> 二 0;s 一 一 ) ”// 输 出 路 径 上 的 中 间 顶 点 


printf(", %d",apath[s]); 
printf("\t 路 径 长 度 为 :%d\n", A[D 0]); 


四 


不 考虑 路 径 输 出 ,Floyd 算法 的 时 间 复 杂 度 为 O0z ) ,其 中 为 图 中 顶点 的 个 数 。 
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设 G==(V,E) 是 一 个 具有 nn 个 顶点 的 有 向 图 ,V 中 的 顶点 序列 wm ,v,，,… ,vw 称 为 一 个 拓 
扑 序列 (topological sequence) 。 若 < wu > 是 图 中 的 一 条 边 或 者 从 顶点 w 到 顶点 v; 有 路 
径 , 则 在 该 序列 中 顶点 w 必须 排 在 顶点 w 之 前 。 

在 一 个 有 向 图 中 找 一 个 拓扑 序列 的 过 程 称 为 拓扑 排序 (topological sort) 。 

例如 ,计算 机 专业 的 学 生 必 须 完 成 一 系列 规定 的 基础 课 和 专业 课 才 能 毕业 ,假设 这 些 课 
程 的 名 称 与 相应 代号 有 如 表 8. 1 所 示 的 关系 。 


表 8.1 课程 名 称 与 相应 代号 的 关系 























课程 代号 课程 名 称 先 修 课程 

和 高 等 数学 无 

C; 程序 设计 无 扫 - 扫 
离散 数学 GC 

C 数据 结构 

Cs 编译 原理 CC 

Cs 操作 系统 CC 和 
CG 计算 机 组 成 原理 eo 


课程 之 间 的 先 修 关 系 可 以 用 一 个 有 向 图 表示 ,如 图 8. 43 所 示 。 这 种 用 顶点 表示 活动 ， 
用 有 向 边 表示 活动 之 间 优 先 关系 的 有 向 图 称 为 顶点 表示 活动 的 网 (activity on vertex 
newtork, AOV 网 ) 。 


图 8. 43 课程 之 间 的 先后 关系 有 向 图 


对 课程 AOV 网 进行 拓扑 排序 可 得 到 一 个 拓扑 序列 : Ci 一 C: 一 C 一 Ci 一 C? 一 Ce 一 Ci 。 
也 可 得 到 另 一 个 拓扑 序列 : C: 一 C; 一 Ci 一 C: 一 Ci 一 Ci; 一 Ce ,还 可 以 得 到 其 他 的 拓扑 序列 。 





学 生 可 以 按照 任何 一 个 拓扑 序列 的 顺序 进行 课程 学 习 。 ~ 


拓扑 排序 方法 如 下 : 

(1) 从 有 向 图 中 选择 一 个 没有 前 驱 ( 即 入 度 为 0) 的 顶点 并 且 输 出 它 。 

(2) 从 图 中 删 去 该 顶点 ,并 且 删 去 从 该 顶点 发 出 的 全 部 有 向 边 。 

(3) 重复 上 述 两 步 , 直 到 剩余 的 图 中 不 再 存在 没有 前 驱 的 顶点 为 止 。 

这 样 操作 的 结果 有 两 种 : 一 种 是 图 中 全 部 顶点 都 被 输出 , 即 该 图 中 所 有 顶点 都 在 其 拓 
扑 序列 中 ,这 说 明 图 中 不 存在 回路 ; 另 一 种 就 是 图 中 顶点 未 被 全 部 输出 ,这 说 明 图 中 存在 回 
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个 存放 顶点 人 度 的 域 count。 即 将 邻接 表 定 义 中 的 VNode 类 型 修改 如 下 : 


typedef struct 





路 (以 课程 之 间 的 先 修 关系 为 例 , 存 在 回路 说 明 一 些 课程 以 自己 为 先 修 关系 )。 

对 一 个 有 向 图 进行 拓扑 排序 ,看 是 否 产 生 全 部 顶点 的 拓扑 序列 来 确定 该 图 中 是 否 存 在 回路 。 
为 了 实现 拓扑 排序 的 算法 ,对 于 给 定 的 有 向 图 ,采用 邻接 表 作 为 存储 结构 ,为 每 个 顶点 

设立 一 个 链表 ,每 个 链表 有 一 个 表 头 结 点 ,这些 表 头 结 点 构成 一 个 数组 , 表 头 结 点 中 增加 一 


所 以 可 以 通过 

















{ Vertex data; // 顶 点 信息 
int count; // 增 加 数据 域 : 存放 顶点 人 度 
ArcNode * firstarc; // 指 向 第 一 个 邻接 点 
} VNode; // 头 结 点 类 型 
在 执行 拓扑 排序 的 过 程 中 , 当 某 个 顶点 的 入 度 为 零 (没有 前 驱 顶 点 ) 时 ， 
就 将 此 顶点 输出 ,同时 将 该 项 点 的 所 有 后 继 顶 点 的 入 度 减 1, 为 了 避免 重复 
检测 入 度 为 零 的 顶点 ,设立 一 个 栈 St, 以 存放 入 度 为 零 的 顶点 。 这 里 采用 顺 
序 栈 , 并 且 直 接 用 St 数组 存放 栈 中 的 元 素 ,top 作为 栈 顶 指针 。 T 
对 应 拓扑 排序 的 算法 如 下 : 视频 讲解 
void TopSort(AdjGraph * G) // 拓 扑 排序 算法 
{ intij; 
int StLMAXV] ,top=—1; // 栈 St 的 指针 为 top 
ArcNode * pi 
for (i=0;i<G 一 nii 十 十 ) // 人 度 置 初 值 0 
G —> adjlist[i] .count=0; 
for (i=0;i<G—>n;it+) // 求 所 有 顶点 的 入 度 
{ p=G—>adjlist[] .firstarc; 
while (p!= NULL) 
{ G—>adjlist[p 一 adjvex].count 十 十 ; 
p=p —> nextarc; 
} 
} 
for (i=0;ii<G 一 nii 十 十 ) // 将 入 度 为 0 的 顶点 进 栈 
if (G —> adjlist[] .count==0) 
Oe 
St[top] =i; 
} 
while (top > 一 1) // 栈 不 空 循环 
{ i=St[top] ;top 一 一 ; // 出 栈 一 个 顶点 i 
printf("%d ",i); // 输 出 该 顶点 
p=G -> adjlist[] .firstare; // 找 第 一 个 邻接 点 
while (p!= NULL) // 将 项 点 i 的 出 边 邻 接点 的 入 度 减 1 


{ j=p—>adjvex; 
G 一 adjlistD].count 一 一 ; 


if (G —> adjlist0] .count==0) // 将 入 度 为 0 的 邻接 点 进 栈 
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St[top] 一 j; 
P=p 一 nextarc; // 找 下 一 个 邻接 点 


} 


【 例 8.14】 给 出 图 8. 44 所 示 的 有 向 图 G 的 全 部 可 能 的 拓扑 排序 序列 。 
国 从 图 G 中 可 以 看 到 ,入 度 为 0 有 两 个 顶点 , 即 © 个 GO) 人 


0 和 4, 先 考虑 顶点 0, 删 除 0 及 相关 边 , 和 人 度 为 0 者 有 
4; 删除 4 及 相关 边 , 入 度 为 0 者 有 1 和 5; 考虑 项 点 1， 
删除 1 及 相关 边 , 入 度 为 0 者 有 2 和 5; 如 此 得 到 拓扑 (4) (5) 


序列 为 041253,041523,045123。 

再 考查 顶点 4, 类 似 地 得 到 拓扑 序列 450123， 
401253,405123,401523。 

因此 ,所 有 的 拓扑 序列 为 041253,041523,045123,450123,401253,405123,401523。 


图 8.44 一 个 有 向 图 G 


AOE 网 与 关键 路 径 。 米 





871 相关 概念 


车 用 前 面 介绍 过 的 有 向 无 环 图 (directed acycline graph,DAG) 描 述 工 
程 的 预计 进度 ,以 顶点 表示 事件 ,有 向 边 表示 活动 , 边 e 的 权 c(e) 表 示 完 成 
活动 e 所 需 的 时 间 ( 如 天 数 ) ,或 者 说 活动 e 持续 时 间 。 图 中 入 度 为 0 的 顶 
点 表示 工程 的 开始 事件 (如 开工 仪式 ) ,出 度 为 0 的 顶点 表示 工程 结束 事件 , 称 这 样 的 有 向 图 
为 边 表示 活动 的 网 (activity on edge network,AOE 网 ) 。 

通常 每 个 工程 都 只 有 一 个 开始 事件 和 一 个 结束 事件 ,因此 表示 工程 的 AOE 网 都 只 有 
一 个 人 度 为 0 的 顶点 , 称 为 源 点 (source) ,和 一 个 出 度 为 0 的 顶点 , 称 为 汇 点 (converge) 。 如 
果 图 中 存在 多 个 人 度 为 0 的 顶点 ,只 要 加 一 个 虚拟 源 点 ,使 这 个 虚拟 源 点 到 原来 所 有 人 度 为 
0 的 点 都 有 一 条 长 度 为 0 的 边 ,从 而 变 成 只 有 一 个 源 点 。 对 存在 多 个 出 度 为 0 的 顶点 的 情 
况 做 类 似 的 处 理 。 所 以 只 需 讨论 单 源 点 和 单 汇 点 的 情况 。 

利用 这 样 的 AOE 网 能 够 计算 完成 整个 工程 预计 需要 多 少时 间 , 并 找 出 影响 工程 进度 














视频 讲解 





的 “关键 活动 ”, 从 而 为 决策 者 提供 修改 各 活动 的 预计 进度 的 依据 。 mm 


在 AOE 网 中 ,从 源 点 到 汇 点 的 所 有 路 径 中 具有 最 大 路 径 长 度 的 路 径 称 为 关键 路 径 
(critical path) 。 完 成 整个 工程 的 最 短 时 间 就 是 AOE 网 中 关键 路 径 的 长 度 ,或 者 说 是 AOE 
网 中 一 条 关键 路 径 上 各 活动 持续 时 间 的 总 和 ,把 关键 路 径 上 的 活动 称 为 关键 活动 (key 
activity) 。 关 键 活动 不 存在 富余 的 时 间 ,而 非 关键 活动 可 能 存在 富余 的 时 间 。 通 常 一 个 
AOE 网 可 能 存在 多 条 关键 路 径 , 但 它们 的 长 度 是 相同 的 。 

因此 ,只 要 找 出 AOE 网 中 的 所 有 关键 活动 也 就 找到 了 全 部 关键 路 径 。 
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例如 ,图 8. 45 表示 某 工程 的 AOE 网 ,共有 9 个 事件 和 11 项 活动 ,其 中 A 表示 源 点 、 
I 表示 汇 点 。 

下 面 介 绍 如 何 利 用 AOE 网 计算 出 完成 整个 工程 需要 的 最 少时 间 , 同 时 找 出 影响 工程 
进度 的 关键 活动 。 

在 AOE 网 中 , 若 存在 两 条 首尾 相 接 的 边 a; 二 < v,w> 和 aj 二 < w,z>, 则 称 活动 w 是 活动 
a 的 前 驱 活 动 ,a; 是 活动 a; 的 后 继 活 动 。 一 个 活动 可 能 有 多 个 前 驱 活 动 和 多 个 后 继 活 动 。 

显然 ,只 有 当 活 动 w 的 所 有 前 驱 活 动 都 完成 后 事件 ww 才 发 生 ( 这 里 zw 是 边 w 的 头 )， 
且 活 动 w 才 可 以 开始 。 如 图 8. 46 所 示 , 当 活动 1 .活动 2 和 活动 3 都 完成 时 ,事件 w 就 发 
生 了 ,活动 w 就 可 以 开始 了 ,所 以 事件 zw 称 为 活动 wj 的 触发 事件 。 





图 8.45 AOE 网 的 示例 图 8.46 前 驱 活动 和 后 继 活 动 


假设 事件 x 是 源 点 、 事 件 y 是 汇 点 ,并 规定 事件 z 的 发 生 时 间 为 0。 定 
义 图 中 任 一 事件 wv 的 最 早 (event early) 开 始 时 间 ve(v) 等 于 x 到 wv 所 有 路 
径 长 度 的 最 大 值 , 即 : 














ve(u) = MAX{c(p)} 
p 
式 中 的 MAX 是 对 源 点 x 到 w 的 所 有 路 径 p 取 最 大 值 ,c(p) 表 示 路 径 视频 讲解 
p 的 长 度 ( 路 径 上 的 所 有 活动 a 的 时 间 之 和 ), 即 : 
ce(p) = >){c(o)} 
a€p 
于 是 完成 整个 工程 所 需 的 最 少时 间 等 于 汇 点 y 的 最 早 开始 时 间 ve(y) 。 
源 点 zx 到 汇 点 y 的 最 长 路 径 就 是 关键 路 径 ,完成 工程 所 需 最 少时 间 就 是 关键 路 径 的 
长 度 。 
例如 ,在 图 8.45 中 A 到 下 的 最 长 路 径 是 A 一 B>E, 其 长 度 等 于 6 十 1 二 7, 所 以 事件 EE 
的 最 早 可 发 生 时 间 等 于 7。 图 8. 45 中 用 粗 线 标 出 的 一 条 关键 路 径 是 A 一 BE 一 GI, 其 长 
度 等 于 6 十 1 十 7 十 4 一 18 ,于 是 完成 整个 工程 至 少 需 18 天 (假设 这 里 的 时 间 单 位 是 天 ) 。 
为 使 事件 v 尽 可 能 早 地 开始 ,处 于 源 点 x 到 事件 v 的 最 长 路 径 上 的 活动 必须 * 刻 不 容 
缓 ? 地 进行 ,一 旦 触发 事件 发 生 , 便 立即 开始 ,而 且 应 当 在 规定 时 间 内 完成 ,否则 事件 " 就 不 
能 按时 开始 ,影响 整个 工程 的 进度 。 例 如 图 8. 45 中 的 活动 ai ,一 旦 事件 B 发 生 ,活动 4 必 
须 立即 开始 。 
而 对 那些 并 不 处 在 最 长 路 径 上 的 活动 来 说 ,即使 稍微 推迟 一 些 时 间 完 成 ,也 对 工程 的 总 
进度 无 碍 。 例 如 ,图 8. 45 中 活动 os 不 处 在 事件 EE 的 最 长 路 径 上 ,只 要 它 在 第 7 天 中 完成 ， 
就 不 至 于 影响 事件 下 的 发 生 , 由 于 路 径 A 一 C 一 E 的 长 度 等 于 4 十 1 二 5, 所 以 活动 as 可 有 
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7 一 5 二 2 天 的 富余 时 间 。 

定义 在 不 影响 整个 工程 进度 的 前 提 下 ,事件 v 必须 开始 的 时 间 称 为 v 的 最 迟 (Cevent 
late) 开 始 时 间 , 记 作 v1(v)。 

那么 v1(v) 应 等 于 ve(y) 与 v 到 汇 点 y 的 最 长 路 径 长 度 之 差 , 即 : 

vl(u) = ve(y)— MAX{c(p)} (8.1) 
式 中 的 MAX 对 wv 到 汇 点 y 的 所 有 路 径 p 取 最 大 值 。 显 然 vI(y) 二 ve(y),vI(z) 二 ve(x) 二 0。 
对 任何 a; 二 <v,w>, 有 : 
ve(v) 十 c(ai) < vl(w) (8.2) 
如 果 上 式 取 等 号 , 即 : 
ve(v) 十 c(ai) = vl(w) (8.3) 
则 称 活动 a; 为 关键 活动 。 反 之 ,上 式 取 小 于 符号 , 则 a; 是 非 关 键 活动 。 

对 关键 活动 来 说 ,不 存在 富余 时 间 , 显 然 关键 路 径 上 的 活动 都 是 关键 活动 。 找 出 关键 活 
动 的 意义 在 于 可 以 适当 地 增加 对 关键 活动 的 投资 (人 力 ,物力 等 ) ,相应 地 减少 对 非 关 键 活动 
的 投资 ,从 而 减少 关键 活动 的 持续 时 间 ,缩短 整个 工程 的 工期 。 

只 要 计算 出 各 顶点 的 ve(v) 和 v1(v) 的 值 ,根据 8. 3 等 式 就 能 找 出 所 有 的 关键 活动 。 为 
了 便于 计算 ,引入 下 面 两 个 递 推 式 ,其 中 zx 和 > 分 别 是 源 点 和 汇 点 。 


ve(Z) 一 0 

ve(w) = A 十 c(Cuym>)) wx (8.4) 
上 式 中 的 MAX 对冲 的 所 有 和 人 边 <uwz > 的 权 取 最 大 值 。 

vl(y) 一 0 

vl(v) = MIN {vl(w)—ce(<v,w>)) vy (8.5) 


所 有 存在 <v,w> 边 的 w 
上 式 中 MIN 对 vv 的 所 有 出 边 <v ,rw > 的 权 取 最 小 值 。 
图 8.47(a) 给 出 了 8.4 式 的 解释 ,其 中 事件 a、b\c 的 最 早 开始 时 间 分 别 为 ve(a)、ve(b) 
和 ve(c) ,假设 它们 都 已 求 出 。 因 为 只 有 <a,w>、<6,w > 和 <c ,rw > 活动 都 完成 才 触 发 事件 
w 发 生 , 所 以 事件 ww 的 最 早 开始 时 间 ve(w) 必 等 于 ve(a) 十 c(<as,w>)、ve(b) 二 c(<b,w>) 
和 ve(c) 十 c(<c,rw>) 三 者 中 的 最 大 值 。 如 果 事 件 w 有 更 多 个 前 驱 事 件 ,求法 类 似 。 











8.47 计算 ve(w) 和 vl(u) 的 递 推 式 的 含义 


只 要 从 源 点 工 起 按照 顶点 的 拓扑 序列 次 序 反复 运用 递 推 式 8.4, 即 可 求 出 各 事件 w( 顶 
点 ) 的 ve(w) 之 值 。 
类 似 的 ,图 8. 47(b) 给 出 了 8. 5 式 的 解释 ,其 中 事件 a、b 和 c 的 最 迟 开 始 时 间 分 别 为 
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vlCo) 、vl(0) 和 vlCc) ,假设 它们 都 已 求 出 。 那 么 事件 " 的 最 迟 开 始 时 间 v1(v) 必 等 于 vl(a) 一 
c(<uya>)、vl(O) 一 c(<u,2>) 和 vl(c) 一 c(<uyc>) 三 者 中 的 最 小 值 。 

只 要 从 汇 点 > 起 按照 顶点 的 拓扑 序列 的 逆序 反复 运用 递 推 式 8. 5, 即 可 求 出 各 个 顶点 
的 最 迟 可 发 生 时 间 v1(v) ,然后 用 8. 3 式 判断 各 有 关 活 动 是 否 为 关键 活动 。 


872 求 AOE 网 的 关键 活动 


综 上 所 述 ,得 出 下 面 求 AOE 网 的 关键 活动 的 步骤 : 

(1) 对 于 源 点 xz, 置 ve(z) 一 0。 

(2) 对 AOE 网 进行 拓扑 排序 ,如 发 现 回 路 ,工程 无 法 进行 ,退出 ; 否则 继续 下 一 步 。 

(3) 按 顶 点 的 拓扑 序列 次 序 反 复 用 8. 4 式 依次 求 其 余 各 顶点 vv 的 ve(v) 值 (实际 上 , 步 
骤 (2) 和 步骤 (3) 可 以 合 在 一 起 完成 , 即 一 边 对 顶点 进行 拓扑 排序 ,一 边 求 出 各 顶点 的 veCv) 
值 ) 。 

(4) 对 于 汇 点 y, 置 vl(y) 二 ve(y)。 

(5) 按 顶 点 拓扑 序列 次 序 之 逆序 反复 用 8. 5 式 依次 求 其 余 各 顶点 的 v1(v) 的 值 。 

(6) 活动 wi 的 最 早 开 始 时 间 e(ai) 是 该 活动 的 起 点 的 最 早 开 始 时 间 。 如 果 a; 二 < j,k >， 
则 有 el(ai) 二 ve())。 

(7) 活动 ai 的 最 迟 开始 时 间 4(ai) 是 该 活动 的 终点 的 最 述 开 始 时 间 与 该 活动 的 所 需 时 
间 之 差 。 如 果 a; 二 <j,k>, 则 有 LCai)==vI(k) 一 c(ai)。 

(8) 一 个 活动 a; 的 最 迟 开始 时 间 4(a;) 和 最 早 开 始 时 间 e(ai) 的 差 , 即 d(ai) 二 1(ai) 一 
elai) , 称 为 该 活动 的 时 间 余 量 。 它 是 在 不 增加 整个 工程 完工 所 需 总 时 间 的 情况 下 活动 w 可 
以 拖延 的 时 间 。 

(9) 当 一 个 活动 的 时 间 富 余 为 零 时 ,说 明 该 活动 必须 如 期 完成 ,否则 就 会 拖延 完成 整个 
工程 的 进度 。 所 以 , 若 d(ai) 二 0, 即 1(a;) 二 elai), 则 活动 a; 是 关键 活动 。 

【 例 8.15】 求 图 8. 45 所 示 的 AOE 网 的 关键 路 径 。 

对 于 该 AOE 网 ,其 中 源 点 为 顶点 A, 汇 点 为 顶点 I。 先 进行 一 次 拓扑 排序 ,假设 产 
生 的 拓扑 序列 为 ABCDEFGHI, 依 此 顺序 计算 各 事件 的 veCv) 如 下 : 

ve(A)=0 

ve(B) 王 ve(A) 十 c(ai ) 王 6 

ve(C) 一 ve(A) 十 c(as ) 一 4 

ve(D) 一 ve(A) 十 c(as ) 一 5 

ve(E) 王 MAX{ve(B) 十 c(as) ,ve(C) 十 c(as)} 王 MAX{17.5} 一 7 

ve(F)=ve(E)+c(ar)=16 

ve(G) 一 ve(E) 十 c(as) 一 14 

ve(H)=ve(D)+c(as)=7 

ve(D)=MAX{ve(F)++c(aw) ,ve(G)++c(an),ve(H)+ce(as)}=MAX{18,18,11}=18 

按 拓扑 序列 逆序 IHGFEDCBA 计算 各 事件 的 v1(v) 如 下 : 

vI(D=ve(D=18 

vI(H)=vI(D—c(as)=14 

vI(G)=vI(D—c(an)=14 
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VvI(F)=vI(D—c(aw)=16 

vI(E)=MIN{vI(F)—c(ar) ,vlI(G)—c(as)}=MIN{7,7}=7 
vI(D)=vI(H)—c(as)=12 

vlI(C)=vI(E)—ce(as)=6 

vI(B)=vI(E)—c(a,)=6 

viI(A)=MIN{vI(B)—c(ai) ,vl(C)—e(as),vID)—ce(as)}=MIN{0,2,7}=0 
计算 各 活动 a 的 ela) (a) 和 d(a) 如 下 : 










































































活动 al: e(a1) 二 ve(A)=0 l(a1)=vI(B)—6=0 d(ai)=0 
活动 a: e(az) 王 ve(A) 王 0 Z(az) 一 vl(C) 一 4 一 2 d(as) 一 2 
活动 a3: e(as) 王 ve(A) 王 0 l(as)=vI(D)—5=7 d(as) 一 7 
活动 ai : e(a) 王 ve(B) 一 6 l(a)=vI(E)—1=6 d(ai)=0 
活动 us : e(as) 二 ve(C)==4 l(as)=vI(E)—1=6 dl(as)=2 
活动 ae : e(as) 二 ve(D)==5 l(as)=vI(H)—2=12 d(as)=7 
活动 wy : e(a1) 二 ve(E)==7 l(ar)=vI(F)—9=7  d(ar)=0 
活动 us : e(as) 二 ve(E)=7 l(as)=v(G)—7=7  d(as)=0 
活动 ae : el(as)= 二 ve(H)=7 l(as)=vl(G)—4=10 dd(as)=3 











活动 ae: elaw) 二 v1I(F)=16 l(aw)=W(D—2=16 d(aw)=0 

活动 au: el(an)==ve(G)=14 l(an)=vWI(D—4=14 d(an)=0 

由 此 可 知 ,关键 活动 有 aa .aio sas .ay vas 、a1 ,因此 关键 路 径 有 两 条 , 即 A 一 B 一 E 一 F 一 I 
和 A 一 B-~E-~G-~I。 

从 求解 结果 看 出 以 下 几 点 : 

(1) 缩短 某 一 活动 的 时 间 ,整个 工期 不 一 定 会 缩短 。 例 如 ,在 8.45 所 示 的 AOE 网 中 将 
活动 we 由 4 天 缩短 为 两 天 ,整个 工期 仍然 需要 18 天 ,因为 关键 路 径 没 有 改变 。 

(2) 缩短 某 一 关键 活动 的 时 间 ,整个 工期 不 一 定 会 缩短 。 例 如 ,在 8.45 所 示 的 AOE 网 
中 将 关键 活动 wy 由 9 天 缩短 为 5 天 ,整个 工期 仍然 需要 18 天 。 因 为 A 一 B 一 EF 一 I 变 为 
非 关 键 路 径 ,而 关键 路 径 A->B-~E-~G->I 的 长 度 仍然 为 18。 

(3) 只 有 缩短 所 有 关键 路 径 共享 的 关键 活动 的 时 间 , 整 个 工期 才 可 能 缩短 。 例 如 ， 
在 8.45 所 示 的 AOE 网 中 将 共享 关键 活动 w 由 6 天 缩短 为 5 天 ,整个 工期 也 缩短 1 天 。 

(4) 缩短 某 一 共享 关键 活动 时 间 为 d(d 二 0) 天 ,整个 工期 不 一 定 会 缩短 d 天 。 例 如 ,在 
8. 45 所 示 的 AOE 网 中 将 共享 关键 活动 wm 由 6 天 缩短 为 两 天 ( 共 缩 短 4 天 ) ,整个 工期 也 仅仅 
缩短 了 两 天 。 因 为 关键 路 径 变 为 A-~C-~E->F->I 和 A 一 C>E>G>I, 其 长 度 为 16。 





一 本 章 小 结 一 一 ~ 
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本 章 的 基本 学 习 要 点 如 下 : 

(1) 掌握 图 的 相关 概念 ,包括 图 、 有 向 图 /无 向 图 、 度 /入 度 /出 度 、 完 全 图 、 子 图 、 连 通 图 、 
强 连 通 图 ,简单 路 径 / 简 单 环 和 网 等 的 定义 。 

(2) 掌握 图 的 各 种 存储 结构 ,包括 邻接 矩阵 和 邻接 表 等 ,理解 它们 的 特点 和 差异 。 

(3) 掌握 图 的 基本 运算 ,包括 创建 图 .销毁 图 和 输出 图 等 。 

(4) 掌握 图 的 深度 优先 遍历 和 广度 优先 遍历 算法 ,以 及 这 两 个 算法 在 图 搜索 算法 设计 
中 的 应 用 。 

(5) 掌握 生成 树 和 最 小 生成 树 的 概念 , 求 带 权 连 通 图 中 最 小 生成 树 的 Prim 和 Kruskal 














































































































算法 。 
(6) 掌握 求 单 源 最 短路 径 的 Dijkstra 算法 和 求 多 源 最 短路 径 的 Floyd 算法 。 
(7) 掌握 拓扑 排序 的 过 程 。 

(8) 掌握 在 AOE 网 中 求 关键 路 径 的 过 程 。 

(9) 灵活 地 运用 图 这 种 数据 结构 解决 一 些 综合 应 用 问题 。 


. 图 G 是 一 个 非 连通 图 ,共有 28 条 边 , 则 该 图 最 少 有 多 少 个 顶点 ? 
. 有 一 个 如 图 8. 48 所 示 的 有 向 图 ,给 出 其 所 有 的 强 连通 分 量 。 
.对 于 稠密 图 和 稀 朴 图 ,采用 邻接 矩阵 和 邻接 表 哪 个 更 好 一 些 ? 
.对 于 个 顶点 的 无 向 图 和 有 向 图 ( 均 为 不 带 权 图 ) , 当 采 用 邻接 矩阵 和 邻接 表 表 示 时 
如 何 求解 以 下 问题 : 

(1) 图 中 有 多 少 条 边 ? 

(2) 任意 两 个 顶点 i 和 j 是 否 有 边 相 连 ? 

(3) 任意 一 个 顶点 的 度 是 多 少 ? 

5， 对 于 如 图 8. 49 所 示 的 一 个 无 向 图 G, 给 出 以 顶点 0 作为 初始 点 的 所 有 的 深度 优先 
遍历 序列 和 广度 优先 遍历 序列 。 

6. 对 于 如 图 8. 50 所 示 的 带 权 无 向 图 ,给 出 利用 Prim 算法 (从 顶点 0 开始 构造 ) 和 
Kruskal 算法 构造 出 的 最 小 生成 树 的 结果 ,要 求 结果 按 构造 边 的 顺序 列 出 。 


2 


图 8.48 一 个 有 向 图 图 8. 49 一 个 无 向 图 G 图 8.50 一 个 带 权 无 向 图 


7. 对 于 一 个 顶点 个 数 超过 4 的 带 权 无 向 图 ,回答 以 下 问题 : 

(1) 该 图 的 最 小 生成 树 一 定 是 唯一 的 吗 ? 如果 所 有 边 的 权 都 不 相同 ,那么 其 最 小 生成 
树 一 定 是 唯一 的 吗 ? 

(2) 如 果 该 图 的 最 小 生成 树 不 是 唯一 的 ,那么 调用 Prim 算法 和 Kruskal 算法 构造 出 的 


和 wo 
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最 小 生成 树 一 定 相 同 吗 ? 

(3) 如 果 图 中 有 且 仅 有 两 条 权 最 小 的 边 ,它们 一 定 出 现在 该 图 的 所 有 最 小 生成 树 中 吗 ? 
简要 说 明理 由 。 

(4) 如 果 图 中 有 且 仅 有 3 条 权 最 小 的 边 ,它们 一 定 出 现在 该 图 的 所 有 最 小 生成 树 中 吗 ? 
简要 说 明理 由 。 

8. 对 于 如 图 8. 51 所 示 的 带 权 有 向 图 ,采用 Dijkstra 算法 
求 出 从 顶点 0 到 其 他 各 顶点 的 最 短路 径 及 其 长 度 ,要 求 给 出 
求解 过 程 。 

9. 对 于 一 个 带 权 连 通 图 ,可 以 采用 Prim 算法 构造 出 从 
某 个 顶点 vv 出 发 的 最 小 生成 树 , 问 该 最 小 生成 树 是 否 一 定 包 
会 从 顶点 v 到 其 他 所 有 顶点 的 最 短路 径 吗 ? 如 果 回 答 是 ,请 
予以 证 明 ; 如 果 回 答 不 是 ,请 给 出 反例 。 

10. 若 只 求 带 权 有 向 图 G 中 从 顶点 i 到 顶点 j 的 最 短路 径 , 如 何 修改 Dijkstra 算法 来 实 
现 这 一 功能 ? 

11. Dijkstra 算法 用 于 求 单 源 最 短路 径 , 为 了 求 一 个 图 中 所 有 顶点 对 之 间 的 最 短路 径 ， 
可 以 以 每 个 顶点 作为 源 点 调用 Dijkstra 算法 ,Floyd 算法 和 这 种 算法 相 比 有 什么 优势 ? 

12. 回答 以 下 有 关 拓 扑 排序 的 问题 ， 


© (1) 给 出 如 图 8. 52 所 示 有 向 图 的 所 有 不 同 的 拓扑 序列 。 
(a) Ka) (2) 什么 样 的 有 向 图 的 拓扑 序列 是 唯一 的 ? 


(3) 现 要 对 一 个 有 向 图 的 所 有 顶点 重新 编号 ,使 所 有 表示 边 
的 非 0 元素 集中 到 邻接 矩阵 数组 的 上 三 角 部 分 。 根 据 什么 顺序 
图 8.52 一 个 有 向 图 。 对 顶点 进行 编号 可 以 实现 这 个 功能 ? 
13. 已 知 有 6 个 顶点 (顶点 编号 为 0~5) 的 带 权 有 向 图 G, 其 邻接 矩阵 数组 A 为 上 三 角 
矩阵 , 按 行为 主 序 ( 行 优先 ) 保 存在 以 下 的 一 维 数组 中 : 





图 8.51 一 个 带 权 有 向 图 G 
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要 求 ， 

(1) 写 出 图 G 的 邻接 矩阵 数组 4 。 

(2) 画 出 带 权 有 向 图 G。 

(3) 求 图 G 的 关键 路 径 , 并 计算 该 关键 路 径 的 长 度 。 

14. 假设 不 带 权 有 向 图 采用 邻接 矩阵 g 存储 ,设计 实现 以 下 功能 的 算法 : 
(1) 求 出 图 中 每 个 顶点 的 入 度 。 

(2) 求 出 图 中 每 个 顶点 的 出 度 。 

(3) 求 出 图 中 出 度 为 0 的 顶点 数 。 

15. 假设 不 带 权 有 向 图 采用 邻接 表 G 存储 ,设计 实现 以 下 功能 的 算法 : 
(1) 求 出 图 中 每 个 顶点 的 入 度 。 

(2) 求 出 图 中 每 个 顶点 的 出 度 。 

(3) 求 出 图 中 出 度 为 0 的 顶点 数 。 

16. 假设 一 个 连通 图 采用 邻接 表 作为 存储 结构 , 试 设计 一 个 算法 ,判断 其 中 是 否 存在 经 
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过 顶点 vv 的 回路 。 

17. 假设 图 G 采用 邻接 表 存 储 , 试 设计 一 个 算法 ,判断 无 向 图 G 是 否 为 一 棵 树 。 若 为 
树 ,返回 真 ; 否则 返回 假 。 

18. 设 5 地 (0 一 4) 之 间架 设 有 6 座 桥 (A 一 F) ,如 图 8. 53 所 示 , 设 计 一 个 算法 ,从 某 地 
出 发 ,经 过 每 座 桥 恰巧 一 次 ,最 后 仍 回 到 原 地 。 

19. 设 不 带 权 无 向 图 G 采用 邻接 表 表 示 ,设计 一 个 算法 求 源 点 i 到 其 余 各 顶点 的 最 短 
路 径 。 
20. 对 于 一 个 带 权 有 向 图 ,设计 一 个 算法 输出 从 顶点 i 到 顶点 j 的 所 有 路 径 及 其 路 径 长 
度 。 调 用 该 算法 求 出 图 8. 35 中 顶点 0 到 顶点 3 的 所 有 路 径 及 其 长 度 。 





图 8.53 实地 图 


一 > 上 机 实验 题 8 -一 


戎 验证 性 实验 

实验 题 1: 实现 图 的 邻接 矩阵 和 邻接 表 的 存储 

目的 : 领会 图 的 两 种 主要 存储 结构 和 图 的 基本 运算 算法 设计 。 

内 容 : 编写 一 个 程序 graph. cpp, 设 计 带 权 图 的 邻接 矩阵 与 邻接 表 的 创建 和 输出 运算 ， 
并 在 此 基础 上 设计 一 个 主 程序 exp8-1. cpp 完成 以 下 功能 。 

(1) 建立 如 图 8. 54 所 示 的 有 向 图 G 的 邻接 矩阵 ,并 
输出 之 。 

(2) 建立 如 图 8. 54 所 示 的 有 向 图 G 的 邻接 表 , 并 输 
出 之 。 

(3) 销毁 图 G 的 邻接 表 。 


实验 题 2: 实现 图 的 遍历 算法 

目的 : 领会 图 的 两 种 遍历 算法 。 

内 容 : 编写 一 个 程序 travsal. cpp 实现 图 的 两 种 遍历 
运算 ,并 在 此 基础 上 设计 一 个 程序 exp8-2. cpp 完成 以 下 功能 。 

(1) 输出 如 图 8. 54 的 有 向 图 G 从 顶点 0 开始 的 深度 优先 遍历 序列 (递归 算法 ) 。 

(2) 输出 如 图 8. 54 的 有 向 图 G 从 顶点 0 开始 的 深度 优先 遍历 序列 ( 非 递归 算法 ) 。 

(3) 输出 如 图 8. 54 的 有 向 图 G 从 顶点 0 开始 的 广度 优先 遍历 序列 。 





8.54 一 个 带 权 有 向 
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实验 题 3: 求 连通 图 的 所 有 深度 优先 遍历 序列 

目的 : 领会 图 的 深度 优先 遍历 算法 。 

内 容 : 编写 一 个 程序 exp8-3. cpp, 假 设 一 个 连通 图 采用 邻接 表 存 储 , 输 出 它 的 所 有 深度 
优先 遍历 序列 ,并 求 图 8. 1(a) 中 从 顶点 1 出 发 的 所 有 深度 优先 遍历 序列 。 


实验 题 4: 求 连通 图 的 深度 优先 生成 树 和 广度 优先 生成 树 

目的 : 领会 图 的 深度 优先 遍历 .广度 优先 遍历 算法 和 生成 树 的 概念 。 

内 容 : 编写 一 个 程序 exp8-4. cpp ,输出 一 个 连通 图 的 深度 优先 生成 树 和 广度 优先 生成 
树 ,并 对 图 8. 24 求 从 顶点 3 出 发 的 一 棵 深度 优先 生成 树 和 一 棵 广度 优先 生成 树 。 


实验 题 5: 采用 普 里 姆 算法 求 最 小 生成 树 

目的 : 领会 普 里 姆 算法 求 带 权 连通 图 中 最 小 生成 树 的 过 程 和 相关 算法 设计 。 

内 容 : 编写 一 个 程序 exp8-5. cpp, 实 现 求 带 权 连通 图 
最 小 生成 树 的 普 里 姆 算法 。 对 于 如 图 8. 55 所 示 的 带 权 连 
通 图 G, 输 出 从 顶点 0 出 发 的 一 棵 最 小 生成 树 。 


实验 题 6: 采用 克 鲁 斯 卡尔 算法 求 最 小 生成 树 

目的 : 领会 克 鲁 斯 卡尔 算法 求 带 权 连 通 图 中 最 小 生 
成 树 的 过 程 和 相关 算法 设计 。 

内 容 : 编写 一 个 程序 exp8-6. cpp, 实 现 求 带 权 连 通 图 
最 小 生成 树 的 克 鲁 斯 卡尔 算法 。 对 于 如 图 8. 55 所 示 的 带 
权 连 通 图 G, 输 出 从 顶点 0 出 发 的 一 棵 最 小 生成 树 。 

实验 题 7: 采用 狄 克 斯 特 拉 算 法 求 带 权 有 向 图 的 最 短路 径 

目的 : 领会 狄 克 斯 特 拉 算法 求 带 权 有 向 图 中 单 源 最 短路 径 的 过 程 和 相关 算法 设计 。 

内 容 : 编写 一 个 程序 exp8-7. cpp ,实现 求 带 权 有 向 图 中 单 源 最 短路 径 的 狄 克 斯 特 拉 算 
法 ,并 输出 如 图 8. 54 所 示 的 带 权 有 向 图 G 中 从 顶点 0 到 达 其 他 各 顶点 的 最 短路 径 长 度 和 
最 短路 径 。 


实验 题 8: 采用 弗 洛 伊 德 算法 求 带 权 有 向 图 的 最 短路 径 

目的 : 领会 弗 洛 伊 德 算法 求 带 权 有 向 图 中 多 源 最 短路 径 的 过 程 和 相关 算法 设计 。 

内 容 : 编写 一 个 程序 exp8-8. cpp, 实 现 求 带 权 有 向 图 中 多 源 最 短路 径 的 弗 洛 伊 德 算 
法 ,并 输出 如 图 8. 54 所 示 的 带 权 有 向 图 G 中 所 有 两 个 顶点 之 间 的 最 短路 径 长 度 和 最 短 
路 径 。 

实验 题 9: 求 AOE 网 中 的 所 有 关键 活动 





图 8.55 一 个 带 权 连通 图 





目的 : 领会 拓扑 排序 和 AOE 网 中 关键 路 径 的 求解 过 程 及 其 算法 设计 。 mm 


内 容 : 编写 一 个 程序 exp8-9. cpp, 求 图 8. 45 中 AOE 网 的 所 有 关键 活动 。 
从 设 计 性 实验 
实验 题 10: 求 有 向 图 的 简单 路 径 
目的 : 掌握 深度 优先 遍历 和 广度 优先 遍历 算法 在 求解 图 路 径 搜索 问题 中 的 应 用 。 
内 容 : 编写 一 个 程序 exp8-10. cpp, 设 计 相 关 算 法 完成 以 下 功能 。 
(1) 输出 如 图 8. 56 的 有 向 图 G 从 顶点 5 到 顶点 2 的 所 有 简单 路 径 。 
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(2) 输出 如 图 8. 56 的 有 向 图 G 从 顶点 5 到 顶点 2 的 所 有 长 度 为 3 的 简单 路 径 。 
(3) 输出 如 图 8. 56 的 有 向 图 G 从 顶点 5 到 顶点 2 的 最 短路 径 。 


实验 题 11: 求 无 向 图 中 满足 约束 条 件 的 路 径 

目的 : 掌握 深度 优先 遍历 算法 在 求解 图 路 径 搜索 问题 中 的 应 用 。 

内 容 : 编写 一 个 程序 exp8-11. cpp, 设 计 相 关 算 法 ,从 如 图 8. 57 所 示 的 无 向 图 中 找 出 满 
足以 下 条 件 的 所 有 路 径 。 





图 8.56 一 个 有 向 图 图 8.57 一 个 无 向 图 


(1) 给 定 起 点 w 和 终点 v。 

(2) 给 定 一 组 必 经 点 , 即 输出 的 路 径 必须 包含 这 些 顶 点 。 

(3) 给 定 一 组 必 避 点 , 即 输出 的 路 径 不 能 包含 这 些 顶 点 。 

实验 题 12: 求解 两 个 动物 之 间 通 信 的 最 少 翻译 问题 

目的 : 掌握 广度 优先 遍历 算法 在 求解 实际 问题 中 的 应 用 。 

内 容 : 编写 一 个 程序 exp8-12. cpp, 完 成 以 下 功能 。 

据 美国 动物 分 类 学 家 欧 内 斯 特 。 迈 尔 推算 ,世界 上 有 超过 一 百 万 种 动物 ,各 种 动物 有 自 
己 的 语言 。 假 设 动物 A 可 以 与 动物 B 进行 通信 (通信 是 双向 的 ) ,但 它 不 能 与 动物 C 通信 ， 
动物 C 只 能 与 动物 B 通信 ,所 以 动物 A、C 之 间 通 信 需 要 动物 已 来 当 翻 译 。 问 两 个 动物 之 
间 相 互通 信 最 少 需要 多 少 个 翻译 ? 

测试 文本 文件 test. txt 中 的 第 一 行 包含 两 个 整数 (2 过 n 志 200) 、m(1 声 m 三 300) ,其 中 
n 代表 动物 的 数量 ,动物 编号 从 0 开始 ,n 个 动物 的 编号 为 0~~n 一 1,m 表示 可 以 互相 通信 的 
动物 对 数 , 接 下 来 的 m 行 中 包含 两 个 数字 分 别 代 表 两 种 动物 可 以 互相 通信 。 再 接 下 来 包含 
一 个 整数 &(k 三 20) ,代表 查询 的 数量 ,每 个 查找 包含 两 个 数字 ,表示 这 两 种 动物 想 要 与 对 方 
通信 。 

设计 算法 ,对 于 每 个 查询 ,输出 这 两 种 动物 彼此 通信 最 少 需要 多 少 个 翻译 , 若 它们 之 间 
无 法 通过 翻译 来 通信 ,输出 一 1。 





输入 样本 输出 结果 
32 0 
01 TL 
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实验 题 13: 求 带 权 有 向 图 中 的 最 小 环 

目的 : 掌握 Floyd 算法 在 求解 实际 问题 中 的 应 用 。 

内 容 : 编写 一 个 程序 exp8-13. cpp, 输 出 带 权 有 向 图 G 中 的 一 个 最 小 环 。 
昭 综 合 性 实验 

实验 题 14: 用 图 搜索 方法 求解 迷宫 问题 

目的 : 深入 掌握 图 遍历 算法 在 求解 实际 问题 中 的 应 用 。 

内 容 : 编写 一 个 程序 exp8-14. cpp, 完 成 以 下 功能 。 

(1) 建立 一 个 迷宫 对 应 的 邻接 表 表示 。 

(2) 采用 深度 优先 遍历 算法 输出 从 入 口 (1,1) 到 出 口 (M,N) 的 所 有 迷宫 路 径 。 

实验 题 15: 用 破 圈 法 求 一 个 带 权 连 通 图 的 最 小 生成 树 

目的 : 深入 掌握 图 的 复杂 操作 、 图 遍历 算法 和 最 小 生成 树 的 概念 ,以 及 最 小 生成 树 的 构 
造 算法 。 

内 容 : 编写 一 个 程序 exp8-15. cpp, 采 用 破 圈 法 求 一 个 带 权 连 通 图 的 最 小 生成 树 ,并 用 
图 8. 27 进行 测试 。 

“ 破 圈 法 ?是 带 权 连 通 图 求 最 小 生成 树 的 另外 一 种 方法 ,其 思路 是 任意 取 一 个 圈 , 去 掉 轿 
上 图 中 权 最 大 的 边 , 反 复 执行 这 个 步骤 ,直到 图 中 没有 圈 为 止 。 
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查找 又 称 为 检索 , 是 指 在 某 种 数据 结构 中 找 出 满足 给 定 条 件 的 
元 素 。 查找 是 一 种 十 分 有 用 的 操作 , 例如 在 学 生成 绩 表 中 查找 某 个 
学 生 的 成 绩 元 素 , 在 图 书馆 的 书目 文件 中 查找 某 编号 的 图 书 元 
素 等 。 

本 章 介绍 线性 表 查 找 、 树 表 查 找 和 哈 希 表 查找 等 相关 算法 设计 
查找 算法 。 


os 可 找 | 


查找 的 基本 概念 小 


被 查找 对 象 是 由 一 组 元 素 ( 或 记录 ) 组 成 的 表 或 文件 , 称 为 查找 表 。 查 找 表 中 的 每 个 元 
素 则 由 若干 个 数据 项 组 成 ,其 中 指定 一 个 数据 项 为 关键 字 (key) ,所 有 元 素 在 关键 字 上 的 取 
值 是 唯一 的 。 在 这 种 条 件 下 ,查找 (search) 的 定义 是 给 定 一 个 值 上 ,在 含有 nn 个 元 素 的 表 中 
找 出 关键 字 等 于 的 元 素 。 若 找到 , 则 查找 成 功 ,返回 该 元 素 的 信息 或 该 元 素 在 表 中 的 位 
置 ; 否则 查找 失败 ,返回 相关 的 指示 信息 。 

因为 查找 是 对 已 存 人 到 计算 机 中 的 数据 进行 的 运算 ,因此 在 研究 各 种 查找 方法 时 ,首先 
必须 弄 清 这 些 查找 方法 所 需要 的 数据 结构 (尤其 是 存储 结构 ) 是 什么 ,对 表 中 关键 字 的 次 序 
有 何 要 求 , 例 如 ,是 对 无 序数 据 查 找 还 是 对 有 序数 据 查找 ? 为 了 提高 查找 速度 ,常常 用 某 些 
特殊 的 数据 结构 来 组 织 表 , 或 对 表 事先 进行 诸如 排序 这 样 的 运算 。 

若 在 查找 的 同时 对 表 做 修改 操作 (如 插入 和 删除 ), 则 相应 的 查找 表 称 为 动态 查找 表 
(dynamic search table) 。 若 在 查找 中 不 涉及 表 的 修改 操作 , 则 相应 的 查找 表 称 为 静态 查找 
表 (static search table) 。 

查找 也 有 内 查找 和 外 查找 之 分 。 若 整个 查找 过 程 都 在 内 存 中 进行 , 则 
称 之 为 内 查找 (internal search); 反之 , 若 查找 过 程 的 需要 访问 外 存 , 则 称 之 
为 外 查找 (external search)。 

在 查找 运算 中 时 间 主 要 花费 在 关键 字 的 比较 上 ,把 平均 需要 和 给 定 值 
A 进行 比较 的 关键 字 次 数 称 为 平均 查找 长 度 (Average Search Length， | 
ASL) ,其 定义 如 下 : 

















ASL = Sy 
iml 


其 中 ,n 是 查找 表 中 元 素 的 个 数 。p; 是 查找 第 i 个 元 素 的 概率 ,通常 假设 每 个 元 素 的 查找 概 
率 相等 ,此 时 p; 二 1/n(1 志 i 过 n) ,ci 是 找到 第 i 个 元 素 所 需 的 关键 字 比 较 次 数 。 
ASL 分 为 查找 成 功 情况 下 的 ASLgw 和 查找 不 成 功 ( 失 败 ) 情 况 下 的 ASL 克 » 。 


ASLa 臣 表示 成 功 查找 到 查找 表 中 的 元 素 , 平 均 需 要 关键 字 比 较 次 数 p; 为 查找 到 第 i 





个 元 素 的 概率 ,有 》) p=1 。 
i=1 
ASL& 功 表示 没有 找到 查找 表 中 的 元 素 , 平 均 需 要 关键 字 比 较 次 数 假设 共有 m 种 查 


找 失败 情况 ,, 为 第 ; 种 情况 的 概率 ,有 》) 4. 一 1 。 


显然 ,ASL 是 衡量 查找 算法 性 能 好 坏 的 重要 指标 。 一 个 查找 算法 的 ASL 越 大 ,其 时 间 
性 能 越 差 ; 反之 ,一 个 查找 算法 的 ASL 越 小 ,其 时 间 性 能 越 好 。 
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线性 表 的 查找 汪 


线性 表 是 一 种 最 简单 的 查找 表 。 本 节 将 介绍 3 种 在 线性 表 上 进行 查找 的 方法 ,它们 分 
别 是 顺序 查找 、 折 半 查 找 和 分 块 查找 。 

查找 与 数据 的 存储 结构 有 关 ,线性 表 有 顺序 和 链 式 两 种 存储 结构 。 这 里 只 介绍 以 顺序 
表 作 为 存储 结构 的 相关 查找 算法 ,顺序 表 属 于 静态 查找 表 。 为 了 算法 通用 ,用 于 查找 运算 的 
顺序 表 采 用 数组 表示 ,该 数组 元 素 的 类 型 声明 如 下 : 




















typedef int KeyType; // 定 义 关键 字 类 型 为 int 
typedef struct 
{ KeyType key; // 关 键 字 项 

InfoType data; // 其 他 数据 项 ,类 型 为 InfoType 
} RecType; // 查 找 元 素 的 类 型 


视频 讲解 
在 介绍 算法 时 ,为 了 突出 主题 ,主要 考虑 元 素 中 的 关键 字 项 。 
921 顺序 查找 


顺序 查找 (sequential search) 是 一 种 最 简单 的 查找 方法 。 它 的 基本 思路 是 从 表 的 一 端 
向 另 一 端 逐 个 将 元 素 的 关键 字 和 给 定 值 & 比较 , 若 相 等 , 则 查找 成 功 ,给 出 该 元 素 在 查找 表 
中 的 位 置 ; 若 整个 查找 表 扫 描 结 束 后 仍 未 找到 关键 字 等 于 A 的 元 素 , 则 查找 失败 。 

顺序 查找 的 算法 如 下 (在 顺序 表 R[0..n 一 1] 中 查找 关键 字 为 k 的 元 素 ,成 功 时 返回 找 
到 的 元 素 的 迎 辑 序号 ,失败 时 返回 0): 


int SeqSearch(RecType RD] ,int n, KeyType k) 


















{ inti=0; 
while (i<n && R[].key! 二 k) 。 // 从 表 头 往 后 找 下 
计 十 ; 时 
if (i>=n) // 未 找到 返回 0 
return 0; 5 
else Eb 
return i 十 1; // 找 到 返回 逻辑 序号 i 十 1 bi 


} 


从 顺序 查找 过 程 中 可 以 看 到 ,c;( 查 找 第 i 个 元 素 所 需要 的 关键 字 比 较 次 数 ) 取 决 于 该 元 
素 在 表 中 的 位 置 。 如 查找 表 中 的 第 1 个 元 素 RL0] 时 仅 需 比较 一 次 ; 而 查找 表 中 的 第 个 
元 素 R[n 一 1] 时 需 比 较 n 次 , 即 c; 二 i。 因 此 ,成 功 时 的 顺序 查找 的 平均 查找 长 度 为 : 
ASLaw Pp, 1 >» 1 a nt) 本 
也 就 是 说 ,顺序 查找 方法 在 查找 成 功 时 的 平均 比较 次 数 约 为 表 长 的 一 半 。 
车 上 值 不 在 表 中 , 则 必须 进行 n 次 比较 之 后 才能 确定 查找 失败 ,所 以 ASL 克 二 nn。 
因此 顺序 查找 算法 的 平均 时 间 复 杂 度 为 0(n) ,其 中 妈 为 查找 表 中 的 元 素 个 数 。 
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在 上 述 顺序 查找 算法 中 ,可 以 在 R 的 末尾 增加 一 个 关键 字 为 & 的 记录 , 称 之 为 哨兵 ,这 
样 查找 过 程 不 再 需要 判断 i 是否 超 界 , 从 而 提高 查找 速度 。 对 应 的 算法 如 下 : 


int SeqSearchl (RecType RD] ,int n,KeyType k) 


{ inti=0; 
R[n] .key=k; 
while (R[D .key!=k) // 从 表 头 往 后 找 
1 
Ta // 未 找到 返回 0 
return 0; 
else 
return i 十 1; // 找 到 返回 逻辑 序号 i 十 1 


} 


归纳 起 来 ,顺序 查找 的 优点 是 算法 简单 , 且 对 表 的 结构 无 特别 要 求 ,无 论 是 用 顺序 表 还 
是 用 链表 来 存放 元 素 ,也 无 论 是 元 素 之 间 是 否 按 关 键 字 有 序 , 它 都 同样 适用 。 顺 序 查找 的 缺 
点 是 查找 效率 低 ,因此 当 较 大 时 不 宜 采 用 顺序 查找 方法 。 
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折 半 查找 (binary search) 又 称 二 分 查找 , 它 是 一 种 效率 较 高 的 查找 方法 。 但 是 , 折 半 查 
找 要 求 线性 表 是 有 序 表 , 即 表 中 的 元 素 按 关键 字 有 序 。 在 下 面 的 讨论 中 ,假设 有 序 表 是 递增 
有 序 的 。 扫 -- 扫 

折 半 查找 的 基本 思路 是 设 R[low..highj] 是 当前 的 查找 区 间 , 首 先 确定 i 
该 区 间 的 中 点 位 置 mid 二 | (low 十 high)/2 | ,然后 将 待 查 的 & 值 与 REmid]. 
key 比较 : 

(1) 若 &=RLmid]. key, 则 查找 成 功 并 返回 该 元 素 的 逻辑 序号 。 视频 讲解 

(2) 若 k 二 RLmidj]. key, 则 由 表 的 有 序 性 可 知 RLmid..highj]. key 均 大 于 A, 因 此 若 表 中 
存在 关键 字 等 于 k 的 元 素 , 则 该 元 素 必定 是 在 位 置 mid 左边 的 子 表 RLlow..mid 一 1] 中 , 故 
新 的 查找 区 间 是 左 子 表 R[low..mid 一 1]。 

(3) 若 >RLmid]. key, 则 关键 字 为 k 的 元 素 必 在 mid 的 右 子 表 RULmid 十 1..high] 中 ， 
即 新 的 查找 区 间 是 右 子 表 RLmid 十 1..high]。 下 一 次 查找 是 针对 新 的 查找 区 间 进 行 的 。 

上 述 过 程 如 图 9. 1 所 示 。 可 以 从 初始 的 查找 区 间 R[0..n 一 1] 开 始 ,每 经 过 一 次 与 当前 
查找 区 间 的 中 点 位 置 上 的 关键 字 比 较 , 就 可 确定 查找 是 否 成 功 , 不 成 功 则 当前 的 查找 区 间 缩 
小 一 半 。 重 复 这 一 过 程 直到 找到 关键 字 为 & 的 元 素 ,或 者 直到 当前 的 查找 区 间 为 空 ( 即 查找 




















失败 ) 时 为 止 。 i 





Rllow] --: RImid-1] REmid] RImid+1] . R[high] 


k<R[mid].key k>R[mid].key 
k=R[mid].key 


R[low] … R[mid-1] | 查找 成 功 RImid+1] :: R[high] 



































9.1 折 半 查找 过 程 
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其 算法 如 下 (在 有 序 表 R[L0..2 一 匡 中 进行 折 半 查找 ,成 功 时 返回 元 素 的 逻辑 序号 ,失败 
时 返回 0) : 


int BinSearch(RecType R[],int n,KeyType k) // 折 半 查 找 算法 
{ intlow=0,high=n—1,mid; 


while (low <=high) // 当 前 区 间 存 在 元 素 时 循环 
{ mid=(low+high)/2; 
if (k==R[mid] .key) // 查 找 成 功 返 回 其 逻辑 序号 mid 十 1 
return mid 十 1; 
if (k<R[mid].key) // 继 续 在 R[low..mid 一 1] 中 查找 
high=mid—1; 
else //k>R[mid].key 
low 王 mid 十 1; // 继 续 在 RUmid 十 1..high] 中 查找 
return 0; // 未 找到 时 返回 0( 查 找 失败 ) 


} 


折 半 查找 过 程 可 用 二 又 树 来 描述 ,把 当前 查找 区 间 的 中 间 位 置 上 的 元 素 作为 根 , 由 左 子 
表 和 右 子 表 构 造 的 二 叉 树 分 别 作为 根 的 左 子 树 和 右 子 树 , 由 此 得 到 的 二 叉 树 称 为 描述 折 半 
查找 过 程 的 判定 树 (decision tree) 或 比较 树 (comparison tree) 。 判 定 树 中 查找 成 功 对 应 的 
结 点 称 为 内 部 结 点 ,而 查找 失败 对 应 的 结 点 称 为 外 部 结 点 。 构 造 外 部 结 点 的 方法 是 ,对 于 内 
部 结 点 中 的 每 个 单 分 支 结 点 ,添加 一 个 作为 它 的 孩子 的 外 部 结 点 使 其 变 成 双 分 支 结 点 ; 对 
于 内 部 结 点 中 的 每 个 叶子 结 点 ,添加 两 个 作为 孩子 的 外 部 结 点 使 其 变 成 双 分 支 结 点 。 判 定 
树 刻画 了 在 所 有 查找 情况 下 进行 折 半 查找 的 比较 过 程 。 

注意 : 折 半 查找 判定 树 的 形态 只 与 表 元 素 个 数 n 相关 ,而 与 输入 实例 中 R[0..n 一 1]. key 
的 取 值 无 关 。 

例如 ,含有 11 个 元 素 (R[0..10]) 的 有 序 表 可 用 图 9. 2 所 示 的 判定 树 来 表示 ,图 中 的 贺 
形 结 点 表示 内 部 结 点 ,内 部 结 点 中 的 数字 表示 该 元 素 在 有 序 表 中 的 下 标 。 长 方形 结 点 表示 
外 部 结 点 ,外 部 结 点 中 的 两 个 值 表示 查找 不 成 功 时 关键 字 等 于 给 定 值 的 元 素 所 对 应 的 元 素 
序号 范围 ,如 外 部 结 点 中 “i~j” 表 示 被 查找 值 是 介 于 R[. key 和 RLjJ. key 之 间 的 , 即 
R[ 站 . key 过 k 达 RLjJ. key, 而 “一 2~~ 一 1” 表 未 过 RL0]. key 对 应 的 外 部 结 点 ,“10 一 cc” 表 
示 A>RL10]. key 对 应 的 外 部 结 点 。 
























































图 9.2 RL0..10] 的 二 分 查找 的 判定 树 (n 二 11) 
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显然 , 若 查找 的 元 素 是 表 中 的 元 素 RL[5]( 处 于 第 1 层 ) ,只 需 进行 1 次 比较 ; 若 查找 的 
元 素 是 表 中 的 元 素 RL2] 或 RL8] ( 均 处 于 第 2 层 ) ,分 别 需 进行 两 次 比较 ; 若 查找 的 元 素 是 
表 中 的 元 素 RL0]、RL3]、RL6J 或 RL9]( 均 处 于 第 3 层 ) ,分 别 需 进 行 3 次 比较 ; 若 查找 的 元 
素 是 表 中 的 元 素 R[1]、R[4]、R[7] 或 R[10] ( 均 处 于 第 4 层 ) ,分 别 需 进行 4 次 比较 。 

说 明 : 上 述 关 键 字 比 较 次 数 并 不 是 算法 中 严格 的 比较 次 数 , 在 BinSearch 算法 中 首先 将 
与 R[mid]. key 进行 1 次 比较 ,车 不 相等 ,再 进行 & 二 RL[mid]. key 的 比较 。 也 就 是 说 ,车 
k 二 RLmid]. key, 需 要 1 次 比较 , 若 k 二 RL[mid]. key, 需 要 两 次 比较 , 若 kR[mid]. key, 也 
需要 两 次 比较 。 这 里 讨论 的 关键 字 比 较 次 数 是 假设 和 R[mid]. key 比较 1 次 就 可 以 知道 3 
种 情况 , 即 关键 字 比 较 的 个 数 。 实 际 上 ,这 样 简化 的 计算 不 影响 算法 的 时 间 复 杂 度 ,后 面 都 
是 采用 这 种 假设 。 

在 nn 个 元 素 的 折 半 查找 判定 树 中 , 设 关 键 字 序列 为 (ki ,ks，,…,k,), 并 有 二 ks 二 … 一 
k, ,查找 的 概率 为 p; ,显然 有 种 查找 成 功 的 情况 ,对 应 的 内 部 结 点 有 个。 成 功 的 折 半 
查找 过 程 恰好 是 走 了 一 条 从 判定 树 的 根 到 被 查 结 点 (内 部 结 点 ) 的 路 径 ,经 历 比较 的 关键 字 
次 数 恰好 为 该 元 素 在 树 中 的 层 数 ,所 以 查找 成 功 的 平均 查找 长 度 为 之 pi Xlevel(k;) ,其 中 
level(k;) 表 示 关 键 字 k; 对 应 内 部 结 点 的 层次 。 

在 这 样 的 判定 树 中 总 共有 2 十 1 种 查找 失败 的 情况 ,对 应 的 外 部 结 点 有 2 十 1 个 ,用 
E;(0 志 i<nn) 来 表示 。Eo 包含 的 所 有 关键 字 A 满足 条 件 k<ki ,E; 包含 的 所 有 关键 字 & 满足 条 
件 记 一 A<A+i 书 ,包含 的 关键 字 A 满足 条 件 人 已 。 而 失败 的 查找 ,其 比较 过 程 是 经 历 了 一 条 
从 判定 树 根 到 某 个 外 部 结 点 的 路 径 , 所 需 的 关键 字 比较 次 数 是 该 路 径 上 内 部 结 点 的 总 数 。 设 


4 是 查找 属于 E; 中 关键 字 的 概率 ,那么 不 成 功 的 平均 查找 长 度 为 > qiX (level(w) 一 1), 其 


中 level(wi) 表 示 E; 对 应 外 部 结 点 的 层次 。 

为 讨论 方便 ,不 妨 设 判 定 树 中 内 部 结 点 的 总 数 为 n= 二 2' 一 1, 将 该 判定 树 近 似 看 成 是 高 
度 为 二 log; (n 十 1) 的 满 二 叉 树 (高 度 有 不 计 外 部 结 点 ), 如 图 9. 3 所 示 。 树 中 第 i 层 上 的 结 
点 个 数 为 2"! ,查找 该 层 上 的 每 个 结 点 恰好 需要 进行 i 次 比较 。 因 此 ,在 等 概率 假设 下 折 半 
查找 成 功 时 的 平均 查找 长 度 为 : 








A A 
SI = Spe 十 >) 2 Xi 一 站 x log | 
i=l i=l 
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图 9.3 判定 树 近 似 看 成 是 一 棵 高 度 为 h 的 满 二 叉 树 
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折 半 查找 在 查找 失败 时 所 需 比 较 的 关键 字 个 数 不 超过 判定 树 的 高 度 ,在 最 坏 情况 下 查 
找 成 功 的 比较 次 数 也 不 超过 判定 树 的 高 度 。 
一 般 情况 下 ,判定 树 中 度数 小 于 2 的 结 点 只 可 能 在 最 下 面 的 两 层 上 (不 计 外 部 结 点 ), 所 以 
nn 个 结 点 的 判定 树 高 度 和 个 结 点 的 完全 二 叉 树 高 度 相 同 , 即 为 log (z 十 1)] 。 由 此 可 见 , 折 
半 查 找 的 最 坏 性 能 和 平均 性 能 相当 接近 。 归 纳 起 来 , 折 半 查找 算法 的 时 复杂 度 为 O(logsn) 。 
也 可 以 这 样 简单 地 推导 , 设 C(n) 为 个 元 素 进行 折 半 查找 的 比较 次 数 ,有 以 下 递 推 式 ，: 
全 
CCa) = 二 Cln/2) 十 1 当 交 之 1 时 
则 ; C(m)==C(n/2) 十 1=C(n/2?) 十 1 十 1 
一 二 C(n/2) 十 1 十 … 十 1 
一 1 十 … 十 1 一 [log | 二 O(logzn) 
虽然 折 半 查找 的 效率 高 ,但 要 求 查找 表 是 按 关键 字 有 序 的 。 另 外 , 折 半 查找 需 确定 查找 
的 区 间 , 因 此 要 求 查找 表 的 存储 结构 具有 随机 存 取 特性 ,所 以 只 适用 于 顺序 表 , 不 适合 于 链 
式 存储 结构 。 需 要 注意 的 是 ,不 能 说 折 半 查找 不 能 用 于 链 式 存储 结构 ,只 是 说 采用 顺序 表 时 
折 半 查找 算法 设计 更 方便 ,效率 更 高 。 
【 例 9.1】 给 定 11 个 数据 元 素 的 有 序 表 (2,3,10,15,20,25,28,29,30,35,40), 采 用 折 
半 查 找 ,试问 : 
(1) 若 查找 给 定 值 为 20 的 元 素 ,将 依次 与 表 中 的 哪些 元 素 比较 ? 
(2) 若 查找 给 定 值 为 26 的 元 素 , 将 依次 与 哪些 元 素 比较 ? 
(3) 假设 查找 表 中 每 个 元 素 的 概率 相同 , 求 查找 成 功 时 的 平均 查找 长 度 和 查找 不 成 功 
时 的 平均 查找 长 度 。 
对 应 的 折 半 查找 判定 树 如 图 9.4 所 示 。 
(1) 若 查找 给 定 值 为 20 的 元 素 , 依 次 与 表 中 的 25、10、15、20 元 素 比 较 , 共 比较 4 次 。 
(2) 若 查找 给 定 值 为 26 的 元 素 , 依 次 与 25 .30、28 元 素 比 较 , 共 比较 3 次 。 
(3) 在 查找 成 功 时 会 找到 图 中 某 个 内 部 结 点 , 则 成 功 时 的 平均 查找 长 度 ， 
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: 共 1 个 结 点 ， 每 个 比较 1 次 
灵 : 共 两 个 结 点 ， 每 个 比较 两 次 


有 : 共 4 个 结 点 ， 每 个 比较 3 次 





: 共 4 个 结 点 ， 每 个 比较 4 次 

































































图 9.4 折 半 查找 判定 树 


在 查找 不 成 功 时 会 找到 图 中 某 个 外 部 结 点 , 则 不 成 功 时 的 平均 查找 长 度 : 


4 义 3 十 8X4 
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923 索引 存储 结构 和 分 块 查找 


索引 存储 结构 (index storage structure) 是 在 存储 数据 的 同时 还 建立 附加 的 索引 表 。 索 
引 表 中 的 每 一 项 称 为 索引 项 ,索引 项 的 一 般 形 式 为 (关键 字 , 地 址 ) 。 扫 -- 扫 

其 中 ,关键 字 唯 一 标识 一 个 结 点 ,地 址 作为 指向 该 关键 字 对 应 结 点 的 指 
针 , 也 可 以 是 相对 地 址 (如 数组 的 下 标 ) 。 

例如 ,对 于 例 1. 1 的 逻辑 结构 City, 将 区 号 看 成 是 关键 字 , 其 索引 存储 全 二 党 
结构 如 图 9. 5 所 示 。 索 引 表 由 (区 号 ,地 址 ) 组 成 ,其 中 区 号 按 递 增 次 序 视频 讲解 
排序 。 





















































索引 表 : 主 数据 表 : 
地 址 ”关键 字 地 址 地 址 区 号 “城市 名 说 明 
300 | 010 100 100 010 Beijing 首都 
310 | 021 130 130 021 Shanghai 直辖 市 
320 | 025 220 160 027 Wuhan 湖北 省 省 会 
330 | 027 160 190 029 Xian 陕西 省 省 会 
340 029 190 220 025 Nanjing 江苏 省 省 会 





























图 9.5 City 的 索引 存储 结构 


在 索引 存储 结构 中 进行 关键 字 查找 时 先 在 索引 表 中 快速 查找 (因为 索引 表 中 按 关键 字 
有 序 排列 ,可 以 采用 折 半 查找 ) 到 相应 的 关键 字 , 然 后 通过 对 应 的 地 址 找到 主 数据 表 中 的 
元 素 。 

索引 存储 结构 可 以 提高 按 关 键 字 查找 元 素 的 效率 ,其 缺点 是 需要 建立 索引 表 而 增加 时 
间 和 空间 的 开销 。 


分 块 查找 (block search) 是 一 种 性 能 介 于 顺序 查找 和 折 半 查找 之 间 的 
查找 方法 。 它 要 求 按 如 下 的 索引 方式 来 存储 线性 表 : 将 表 RL0..n 一 1j 均 分 
为 2 块 ,前 2 一 1 块 中 的 元 素 个 数 为 *= [人 |, 最 后 一 块 ( 即 第 45 块 ) 的 元 素 8 
数 小 于 等 于 s; 每 一 块 中 的 关键 字 不 一 定 是 有 序 的 ,但 前 一 块 中 的 最 大 关键 全 本 
字 必 须 小 于 后 一 块 中 的 最 小 关键 字 , 即 要 求 整 个 表 是 “分 块 有 序 ”(block order) 的 。 

抽取 各 块 中 的 最 大 关键 字 及 其 起 始 位 置 构 成 一 个 索引 表 IDX[L0..5 一 1], 即 IDX[i](0 志 
i 和 0 一 1) 中 存放 着 第 i 十 1 块 的 最 大 关键 字 及 该 块 在 表 R 中 的 起 始 位 置 。 由 于 表 R 是 分 块 
有 序 的 ,所 以 索引 表 是 一 个 递增 有 序 表 。 








索引 表 的 数据 类 型 声明 如 下 : 

# define MAXI < 索引 表 的 最 大 长 度 > 

typedef struct 

{ KeyType key; //KeyType 为 关键 字 的 类 型 
int link; // 指 向 对 应 块 的 起 始 下 标 

} IdxType; // 索 引 表 元 素 的 类 型 
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例如 , 设 有 一 个 线性 表 采 用 顺序 表 存 储 ,其 中 包含 25 个 元 素 , 其 关键 字 序 列 为 (8,14,6， 
9,10,22,34,18,19,31,40,38,54,66,46,71,78,68,80,85,100,94,88,96,87)。 假 设 将 25 
个 元 素 分 为 5 块 (6 二 5) ,每 块 中 有 5 个 元 素 (s 二 5), 该 线性 表 的 索引 存储 结构 如 图 9. 6 所 
示 。 第 一 块 中 的 最 大 关键 字 14 小 于 第 2 块 中 的 最 小 关键 字 18, 第 2 块 中 的 最 大 关键 字 34 
小 于 第 3 块 中 的 最 小 关键 字 38, 依 此 类 推 。 





14 | 34 | 66 | 85 |100| key 
0|5|10|15|20 | link 









































数据 表 


8s|14|6|9 [10|22|34|1s|10|31 88 | 96 | 87 


0 123 4 5 .67 8 9 10112131415 1617 18 1 20 2 22 23 24 
图 9.6 分 块 查 找 的 索引 存储 结构 




















例如 ,在 图 9. 6 所 示 的 存储 结构 中 查找 关键 字 等 于 给 定 值 二 80 的 元 素 , 因 为 索引 表 
小 ,不 妨 用 顺序 查找 方法 查找 索引 表 。 即 首先 将 & 依次 和 索引 表 中 的 各 关键 字 比较 ,直到 找 
到 第 1 个 关键 字 大 于 等 于 & 的 元 素 , 由 于 A 委 85 ,所 以 关键 字 为 80 的 元 素 若 存在 , 则 必定 在 
第 4 块 中 ; 然后 由 IDXL3J. link 找到 第 4 块 的 起 始 地 址 15, 从 该 地 址 开始 在 RL15..19] 中 进 
行 顺序 查找 ,直到 RL18]. key 一 为止。 共有 8 次 关键 字 比 较 。 

若 给 定 值 4 一 30, 先 确定 在 第 2 块 中 ,然后 在 该 块 中 查找 。 因 该 块 中 查找 不 成 功 , 故 说 
明 表 中 不 存在 关键 字 为 30 的 元 素 。 共 有 7 次 关键 字 比 较 。 

分 块 查找 的 基本 思路 是 首先 查找 索引 表 , 因 为 索引 表 是 有 序 表 , 故 可 采用 折 半 查找 或 顺 
序 查找 ,以 确定 待 查 的 元 素 在 哪 一 块 ; 然后 在 已 确定 的 块 中 进行 顺序 查找 ( 因 块 内 元 素 无 
序 , 只 能 用 顺序 查找 ) 。 

采用 折 半 查找 索引 表 的 分 块 查找 算法 如 下 (索引 表 工 的 长 度 为 2) : 


int IdxSearch(IdxType I[] ,int b, RecType RD] ,int n, KeyType k) 。 // 分 块 查找 


{ ints=(n+b—1)/b; //s 为 每 块 的 元 素 个 数 ,应 为 [n/b | 
int low=0, high=b—1, mid,i; 
while (low <= high) // 在 索引 表 中 进行 折 半 查找 ,找到 的 位 置 为 high 十 1 


{ mid=(low+high)/2; 
if (I[mid] .key >=k) 
high= mid—1; 
else 
low=mid+1; 
} 
// 应 先 在 索引 表 的 high 十 1 块 中 查找 ,再 在 主 数 据 表 中 进行 顺序 查找 
i=I[high+1].link; 
while (i<=I[high+1].link+s—1 && RO].key!=k) 
ts 
if (i<=I[hight+1].link+s—1) 
return i 十 1; // 查 找 成 功 ,返回 该 元 素 的 逻辑 序号 
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else 
return 0; // 查 找 失败 ,返回 0 
} 


由 于 分 块 查找 实际 上 是 进行 了 两 次 查找 过 程 ( 所 以 分 块 查找 最 少 需要 2 次 关键 字 比 
较 ), 故 整个 查找 过 程 的 平均 查找 长 度 是 两 次 查找 的 平均 查找 长 度 之 和 。 
车 及 个 元 素 , 每 块 中 有 ;个 元 素 (R 中 总 块 数 0 一 | zs |] ) ,分 析 分 块 查找 在 成 功 情况 
下 的 平均 查找 长 度 如 下 : 
若 以 折 半 查找 来 确定 元 素 所 在 的 块 , 则 分 块 查找 成 功 时 的 平均 查找 长 度 为 : 
ASL 一 ASLt 十 ASL。 


logs (6 +1) 1 十 于 1 











一 log:Cz/s 十 1D) 十 立 或 log:(0 十 1) 十 总 


显然 , 当 s 越 小 时 ,ASLwx 的 值 越 小 , 即 当 采 用 折 半 查找 确定 块 时 每 块 的 长 度 越 小 越 好 。 
若 以 顺序 查找 来 确定 元 素 所 在 的 块 , 则 分 块 查找 成 功 时 的 平均 查找 长 度 为 : 


ASLn = ASLw 十 ASLa — “1 + 二 1! 和 + 十 1 或 却 (0 十 习 +1 


显然 , 当 s 二 Vn 时 ,ASLtw 取 极 小 值 Yn 十 1, 即 当 采 用 顺序 查找 确定 块 时 各 块 中 的 元 素数 
选 定 为 时 效果 最 佳 。 

分 块 查找 的 主要 缺点 是 增加 一 个 索引 表 的 存储 空间 和 增加 建立 索引 表 的 时 间 。 

【 例 9.2】 对 于 具有 10 000 个 元 素 的 文件 。 

(1) 车 采用 分 块 查找 法 查找 ,并 通过 顺序 查找 来 确定 元 素 所 在 的 块 , 则 分 成 几 块 最 好 ? 
每 块 的 最 佳 长 度 为 多 少 ? 此 时 的 平均 查找 长 度 为 多 少 ? 

(2) 若 采用 分 块 查找 法 查找 ,假定 每 块 长 度 为 ;==20, 此 时 的 平均 查找 长 度 是 多 少 ? 

(3) 车 直接 采用 顺序 查找 和 折 半 查找 ,其 平均 查找 长 度 各 是 多 少 ? 

(1) 对 于 具有 10 000 个 元 素 的 文件 , 若 采用 分 块 查找 法 查找 ,并 通过 顺序 查找 来 确 
定 元 素 所 在 的 块 ,每 块 中 的 最 佳 元 素 个 数 ;二 V10 000 二 100, 总 的 块 数 5 二 |n/s | 二 100。 此 
时 有 : 

















ASLan = 去 (+ 二 1 一 100 十 1= 101 
如 果 此 时 采用 折 半 查找 确定 块 ,平均 查找 长 度 为 : 
ASLaa = logs (5 +1) 车 志 一 logz101 十 50 > 57 




















(2) s==20, 则 5=[n/s |]==10 000/20 王 500。 
在 进行 分 块 查找 时 , 若 用 顺序 查找 确定 块 , 则 有 ASLxw = 去 (6+9) 十 1 一 260 十 1 一 261。 





在 进行 分 块 查 找 时 , 若 用 折 半 查找 确定 块 , 则 有 ASLaa 一 log: (0 十 1) 十 广 一 logz501 十 
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(3) 车 直接 采用 顺序 查找 , 则 有 ASLaa 一 (10 000 十 1)/2 一 5000.5。 
若 直接 采用 折 半 查找 , 则 有 ASLixw 二 logs10 001 一 1>*13。 
由 此 可 见 , 分 块 查找 算法 的 效率 介 于 顺序 查找 和 折 半 查找 之 间 。 


树 表 的 查找 


从 9.2 节 的 讨论 可 知 , 当 用 线性 表 作为 表 的 组 织 形式 时 可 以 有 3 种 查 
找 法 ,其 中 以 折 半 查找 的 效率 最 高 。 但 由 于 折 半 查找 要 求 表 中 的 元 素 按 关 
键 字 有 序 , 且 不 适合 采用 链表 存储 结构 ,因此 当 表 的 插入 或 删除 操作 频繁 
时 ,为 维护 表 的 有 序 性 ,需要 移动 表 中 的 很 多 元 素 。 这 种 由 移动 元 素 引起 的 
额外 时 间 开 销 会 抵消 折 半 查找 的 优点 。 若 要 对 动态 查找 表 进行 高 效率 的 查 
找 ,可 采用 本 节 介 绍 的 几 种 特殊 的 二 叉 树 / 树 作为 表 的 组 织 形式 ,在 这 里 将 

















视频 讲解 


它们 统称 为 树 表 (tree table) 。 下 面 分 别 讨论 在 这 些 树 表 上 进行 查找 和 修改 操作 的 方法 。 


931 二 又 排序 树 


二 叉 排序 树 (binary search tree, BST) 又 称 二 叉 搜 索 树 ,其 定义 为 二 叉 
排序 树 或 者 是 空 树 ,或 者 是 满足 以 下 性 质 的 二 叉 树 。 

(1) 车 根 结 点 的 左 子 树 非 空 , 则 左 子 树 上 的 所 有 结 点 关键 字 均 小 于 根 
结 点 关键 字 ; 


扫 一 扫 















人 
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(2) 若 根 结 点 的 右 子 树 非 空 , 则 右 子 树 上 的 所 有 结 点 关键 字 均 大 于 根 结 点 关键 字 ; 


(3) 根 结 点 的 左 、 右 子 树 本 身 又 各 是 一 棵 二 叉 排序 树 。 


上 述 性 质 简 称 二 叉 排 序 树 性 质 (BST 性 质 ) , 故 二 叉 排 序 树 实际 上 是 满足 BST 性 质 的 二 


叉 树 。 也 就 是 说 ,二 又 排序 树 是 在 二 又 树 基础 上 增加 了 结 点 值 的 约束 。 


由 BST 性 质 可 知 ,二 又 排序 树 中 的 任 一 结 点 ,其 左 子 树 中 的 任 一 结 点 >( 若 存在 ) 的 关 
键 字 必 小 于 zx 的 关键 字 , 其 右 子 树 中 的 任 一 结 点 =( 若 存在 ) 的 关键 字 必 大 于 z 的 关键 字 。 
如 此 定义 的 二 叉 排 序 树 中 ,各 结 点 关键 字 是 唯一 的 。 但 在 实际 应 用 中 ,不 能 保证 被 查找 的 数 
据 集中 各 元 素 的 关键 字 互 不 相同 ,所 以 可 将 二 叉 排序 树 定义 中 BST 性 质 (1) 里 的 “小 于 ” 改 
为 “小 于 等 于 ”, 或 将 BST 性 质 (2) 里 的 “大 于 ? 改 为 “大 于 等 于 ”, 甚 至 修改 为 左 子 树 关键 字 


大 , 右 子 树 关键 字 小 。 本 章 讨论 的 均 为 满足 前 面 BST 性 质 的 二 又 排序 树 。 


从 BST 性 质 可 推出 二 又 排序 树 的 另 一 个 重要 性 质 : 按 中 序 遍 历 该 树 所 得 到 的 中 序 序 


列 是 一 个 递增 有 序 序 列 。 
在 讨论 二 又 排序 树 上 的 运算 算法 之 前 声明 其 结 点 的 类 型 如 下 : 


typede fstruct node // 元 素 类 型 

{ KeyType key; // 关 键 字 项 
InfoType data; // 其 他 数据 域 
struct node * lchild, * rchild; // 左 、 右 孩子 指针 

} BSTNode; 


和 二 又 链 一 样 ,我 们 也 是 通过 根 结 点 指针 bt 来 唯一 标识 一 棵 二 又 排序 树 。 
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在 二 又 排序 树 中 插入 一 个 关键 字 为 人 的 结 点 要 保证 插入 后 仍 满足 BST 要- 要 
性 质 。 其 插入 过 程 是 : 车 二 又 排序 树 bt 为 空 , 则 创建 一 个 key 域 为 上 的 结 点 ， 
将 它 作 为 根 结 点 ; 否则 将 & 和 根 结 点 的 关键 字 比 较 , 若 两 者 相等 , 则 说 明 树 中 
已 有 此 关键 字 A, 无 须 插入 ,直接 返回 假 ; 车 Rk 二 bt 一 > key, 则 将 上 插入 根 结 点 FT 
的 左 子 树 中 ,否则 将 它 插 入 右 子 树 中 。 对 应 的 递归 算法 InsertBSTO 〇 如 下 : 视频 讲解 

















bool InsertBST(BSTNode * & bt,KeyType k) 
// 在 二 叉 排序 树 bt 中 插入 一 个 关键 字 为 k 的 结 点 ,车 插入 成 功 返回 真 ,否则 返回 假 
{ if(bt==NULL) // 原 树 为 空 ,新 插入 的 结 点 为 根 结 点 
{ bt=(BSTNode * )malloc(sizeof(BSTNode)); 
bt 一 key=k;bt—> lchild= bt 一 rchild= NULL; 
return true; 
} 
else if (k== bt —> key) // 树 中 存在 相同 关键 字 的 结 点 ,返回 假 
return false; 
else if (k< bt —> key) 
return InsertBST(bt -> lchild, k) ; // 插 入 到 左 子 树 中 
else 


return InsertBST(bt 一 rchild, k); // 插 入 到 右 子 树 中 








} 


上 述 算法 是 在 根 结 点 指针 为 bt(bt 可 能 为 空 ) 的 二 叉 排 序 树 中 搬入 一 个 关键 字 值 为 人 
的 结 点 ,bt 可 能 发 生变 化 ,所 以 一 定 要 用 引用 类 型 ,即将 bt 改变 后 的 值 回 传 给 实 参 ,和 否则 可 
能 出 现 错误 。 

创建 一 棵 二 又 排序 树 是 从 一 个 空 树 开 始 的 ,每 插入 一 个 关键 字 , 就 调用 一 次 插入 算法 将 
它 插 入 到 当前 已 生成 的 二 叉 排 序 树 中 。 从 关键 字数 组 a[0..n 一 1] 生 成 二 又 排 序 树 的 算法 
CreateBST() 如 下 : 


BSTNode * CreateBST(KeyType A[] ,int n) // 创 建 二 又 排序 树 
// 返 回 BST 树 根 结 点 指针 
{ BSTNode * bt=NULL; // 初 始 时 bt 为 空 树 
int i=0; 
while (i<n) 
{ InsertBST(bt,a[i]); // 将 关键 字 a 中 插入 二 叉 排 序 树 bt 中 
i 
} 
return bt; // 返 回 建立 的 二 叉 排序 树 的 根 指针 


} 


假设 a[]={3,1,2} ,调用 CreateBST(a,3) 构 造 二 又 排序 树 的 过 程 如 下 : 

OO 执行 CreateBST(a.3) bt=NULL ,第 1 次 循环 调用 InsertBST(Cbt,3) 。 

@ 调用 InsertBST(bt,3) 的 执行 过 程 如 图 9.7 所 示 ,返回 只 有 一 个 结 点 (关键 字 为 3) 的 
二 又 排序 树 bt。 
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图 9.7 InsertBST(bt,3) 的 执行 过 程 











@ 第 2 次 循环 调用 InsertBST(bt,1) ,其 执行 过 程 如 图 9. 8 所 示 , 返 回 有 两 个 结 点 ( 关 
键 字 分 别 为 3 和 1) 的 二 叉 排序 树 bt。 
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图 9.8 InsertBST(bt,1) 的 执行 过 程 


@ 第 3 次 循环 调用 InsertBST(bt,2), 其 执行 过 程 如 图 9.9 所 示 , 返 回 有 3 个 结 点 ( 关 
键 字 分 别 为 3、1、2) 的 二 叉 排 序 树 bt。 
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图 9.9 InsertBST(bt,2) 的 执行 过 程 





回 返回 最 终 构造 好 的 二 叉 排 序 树 bt。 

从 中 可 以 看 到 ,每 个 结 点 插入 时 都 需要 从 根 结 点 开始 比较 ,车 比 根 结 点 的 key 值 小 , 当 
前 指针 移 到 左 子 树 , 否 则 当前 指针 移 到 右 子 树 ,如 此 这 样 ,直到 当前 指针 为 空 ,再 创建 一 个 结 
点 ,由 当前 指针 指向 它 , 这 样 便 将 这 个 结 点 插入 到 二 又 排 序 树 中 了 。 因 此 可 知 ,任何 结 点 插 
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入 到 二 又 排序 树 时 都 是 作为 叶子 结 点 插入 的 。 

对 于 一 组 关键 字 集 合 , 若 关键 字 序列 不 同 , 上 述 算法 生成 的 二 叉 排 序 树 可 能 不 同 。 例 
如 ,关键 字 序 列 为 (5,2,1,6,7,4,8,3,9), 生 成 的 二 叉 排序 树 如 图 9. 10(a) 所 示 ; 关键 字 序 列 
为 (1,2,3,4,5,6,7,8,9), 上 述 算 法 生成 的 二 叉 排 序 树 如 图 9. 10(b) 所 示 。 显 然 图 9. 10(a) 
所 示 的 二 叉 排 序 树 的 查找 效率 比 图 9. 10(b) 的 好 ,因此 构造 一 棵 高 度 越 小 的 二 叉 排序 树 查 
找 效率 越 高 ,下 一 小 节 就 来 讨论 如 何 构造 这 种 查找 效率 高 的 二 又 排序 树 。 





图 9. 10 两 棵 二 叉 排 序 树 


因为 二 叉 排序 树 的 中 序 序 列 是 一 个 有 序 序列 ,所 以 对 于 一 个 任意 的 关键 字 序列 构造 一 
棵 二 又 排序 树 ,其 实质 是 对 此 关键 字 序列 进行 排序 ,使 其 变 为 有 序 序列 “排序 树 ”的 名 称 也 
由 此 而 来 。 

另外 ,二 又 排序 树 销毁 算法 DestroyBST 的 设计 思路 与 二 又 树 销毁 算法 完全 相同 。 


2~ 二 文 排序 树 的 查找 扫 -- 扫 
因为 二 又 排序 树 可 看 成 是 有 序 的 ,所 以 在 二 又 排序 树 上 进行 查找 和 折 | 而 
半 查 找 类 似 , 也 是 一 个 逐步 缩小 查找 范围 的 过 程 。 递 归 查 找 算 法 
SearchBST() 如 下 (在 二 又 排序 树 bt 上 查找 关键 字 为 & 的 元 素 ,成 功 时 返回 
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该 结 点 指针 ,否则 返回 NULL): 
BSTNode * SearchBST(BSTNode * bt,KeyType k) // 二 叉 排序 树 查找 
{ if(bt==NULL | bt 一 > key 一 一 k) // 递 归结 束 条 件 
return bt; 
if (k<bt—> key) 
return SearchBST( bt —> lchild, k); // 在 左 子 树 中 递归 查找 
else 
return SearchBST(bt -> rchild, k); // 在 右 子 树 中 递归 查找 


} 
如 果 不 仅 要 找到 关键 字 为 & 的 结 点 ,还 要 找到 其 双亲 结 点 ,采用 的 递归 查找 算法 如 下 : 
BSTNode * SearchBST1(BSTNode * bt,KeyType k,BSTNode *{1,BSTNode * 8&f) 


/x 在 二 叉 排序 树 bt 中 查找 关键 字 为 k 的 结 点 , 若 查找 成 功 ,该 函数 返回 该 结 点 的 指针 ,f 返 回 其 双亲 
结 点 ;否则 ,该 函数 返回 NULL, 其 调用 方法 如 下 : 
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SearchBST1(bt, x, NULL.,f); 
这 里 的 第 3 个 参数 日 仅 作 中 间 参 数 ,用 于 求 ,初始 设 为 NULL * / 
{ f(bt==NULL) 
{ f=NULL; 
return( NULL); 
} 
else 让 (k== bt—> key) 
{ f=fl; 
return(bt) ; 
} 
else if (k< bt—> key) 
return SearchBST1(bt 一 > lchild, k, bt, f); // 在 左 子 树 中 递归 查找 
else 
return SearchBST1(bt —> rchild, k, bt, f) ; // 在 右 子 树 中 递归 查找 
} 


和 折 半 查找 的 判定 树 类 似 , 二 叉 排 序 树 中 的 结 点 作为 内 部 结 点 ,可 以 添加 相应 的 外 部 结 
点 。 具 有 nn 个 内 部 结 点 的 二 叉 排 序 树 , 其 外 部 结 点 的 个 数 为 x 十 1。 

显然 ,在 二 叉 排序 树 上 进行 查找 , 若 查 找 成 功 , 则 是 从 根 结 点 出 发 走 了 一 条 从 根 结 点 到 
某 个 内 部 结 点 的 路 径 ; 车 查找 不 成 功 , 则 是 从 根 结 点 出 发 走 了 一 条 从 根 结 点 到 某 个 外 部 结 
点 的 路 径 。 因 此 与 折 半 查找 类 似 , 其 关键 字 比 较 的 次 数 不 超 过 树 的 高 度 。 

然而 ,用 折 半 查找 法 查找 长 度 为 n 的 有 序 表 , 其 判定 树 是 唯一 的 ,而 含有 个 元 素 的 二 
叉 排 序 树 却 不 唯一 。 对 于 含有 同样 一 组 元 素 的 表 , 由 于 元 素 插 入 的 先后 次 序 不 同 ,所 构成 的 
二 叉 排序 树 的 形态 和 高 度 可 能 不 同 ,如 图 9. 10(a) 和 图 9. 10(b) 所 示 的 两 棵 二 叉 排序 树 的 高 
度 分 别 是 5 和 9。 因 此 在 查找 失败 的 情况 下 ,在 这 两 棵 树 上 所 进行 的 关键 字 比 较 次 数 最 多 
分 别 为 5 和 9; 在 查找 成 功 的 情况 下 ,它们 的 平均 查找 长 度 也 不 相同 。 

对 于 图 9. 10(a) 所 示 的 二 叉 排 序 树 ,在 等 概率 假设 下 ,查找 成 功 的 平均 查找 长 度 如 下 : 


1X1 十 2X2 十 3X3 十 2X4 十 1X5 
9 


类 似 地 ,图 9.10(b) 所 示 的 二 又 排序 树 在 查找 成 功 时 的 平均 查找 长 度 为 : 


1X1 二 11X22 二 1X3 二 11X44 二 1X5 二 1X6 十 11X71X81X9 
9 


由 此 可 见 ,在 二 又 排序 树 上 进行 查找 时 的 平均 查找 长 度 和 二 叉 排 序 树 的 形态 有 关 。 
在 最 坏 情况 下 ,二 又 排序 树 是 通过 把 一 个 有 序 表 的 个 元 素 依次 插入 而 生成 的 ,此 时 所 得 
的 二 叉 排序 树 赔 化 为 一 棵 高 度 为 n 的 单 支 树 , 它 的 平均 查找 长 度 和 单 链表 上 的 顺序 查找 
相同 ,也 是 (z 十 1)/2。 在 最 好 情况 下 ,二 又 排序 树 在 生成 的 过 程 中 树 的 形态 比较 匀称 ,最 
终 得 到 的 是 一 棵 形态 与 折 半 查找 的 判定 树 相 似 的 二 又 排序 树 ,此 时 它 的 平均 查找 长 度 大 
约 是 logsn。 

就 平均 时 间 性 能 而 言 (考虑 一 组 关键 字 所 有 排列 构成 的 所 有 二 又 排序 树 的 平均 情况 ) , 
二 叉 排序 树 上 的 查找 和 折 半 查找 差不多 。 但 就 维护 表 的 有 序 性 而 言 ,二 又 排序 树 更 有 效 , 因 
为 无 须 移动 元 素 , 只 需 修改 指针 即 可 完成 结 点 的 插入 和 删除 操作 , 且 其 平均 的 执行 时 间 均 为 
O(log:7z) 。 
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【 例 9.3】 已 知 一 组 关键 字 为 (25,18,46,2,53,39,32,4,74,67,60,11) , 按 表 中 的 关键 
字 顺 序 依次 插入 到 一 棵 初始 为 空 的 二 又 排序 树 中 , 画 出 该 二 叉 排序 树 ,并 求 在 等 概率 的 情况 
下 查找 成 功 和 查找 不 成 功 的 平均 查找 长 度 。 

生成 的 二 叉 排 序 树 如 图 9. 11(a) 所 示 。 











所 以 有 : 

ASLaa 0 RE 
加 上 外 部 结 点 的 二 叉 排 序 树 如 图 9.11(b) 所 示 , 所 以 有 : 

ASLram = 1!X2+3X3+4X4+3X5+2X6 -4.15 
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(a) 一 棵 二 叉 排序 树 (b) 加 上 外 部 结 点 的 二 叉 排序 树 
图 9.11 一 棵 二 叉 排 序 树 及 加 上 外 部 结 点 以 后 


【 例 9.4】 设计 一 个 算法 ,对 于 给 定 的 二 又 排序 树 中 的 结 点 p, 找 出 其 左 子 树 中 的 最 大 
结 点 和 右 子 树 中 的 最 小 结 点 。 

根据 二 又 排序 树 的 定义 可 知 ,一 棵 二 又 排序 树 中 的 最 大 结 点 为 根 结 点 的 最 右 下 结 
点 ,最 小 结 点 为 根 结 点 的 最 左下 结 点 。 

对 应 的 算法 如 下 : 


void maxminnode(BSTNode * p) 
{ if(p!=NULL) 
{ ip 一 lchild!=NULL) 
printf(" 左 子 树 的 最 大 结 点 为 :%d\n", maxnode(p 一 lchild)); 
if (p—> rchild!= NULL) 
printf(" 右 子 树 的 最 小 结 点 为 :%d\n", minnode(p 一 > rchild) ); 





} aa 


} 

KeyType maxnode(BSTNode * p) // 返 回 一 棵 二 叉 排序 树 中 的 最 大 结 点 关键 字 
{ while (p—>rchild!=NULL) 

p=p—> rchild; 
return(p 一 > data) ; 

} 

KeyType minnode(BSTNode * p) // 返 回 一 棵 二 叉 排序 树 中 的 最 小 结 点 关键 字 
{ while (p—> 1child!=NULL) 
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p=p—> lchild; 
Teturn(p 一 > data) ; 


有 


人 

在 从 二 又 排序 树 中 删除 一 个 结 点 时 不 能 直接 把 以 该 结 点 为 根 的 子 树 都 
删 去 ,只 能 删除 该 结 点 本 身 , 并 且 还 要 保证 删除 后 所 得 的 二 叉 树 仍然 满足 
BST 性 质 。 也 就 是 说 ,在 二 又 排序 树 中 删 去 一 个 结 点 相当 于 删 去 有 序 序列 
( 即 该 树 的 中 序 序列 ) 中 的 一 个 元 素 。 on 

删除 操作 必须 首先 进行 查找 ,假设 在 查找 结束 时 p 指向 要 删除 的 结 点 。 删 除 过 程 分 为 
以 下 几 种 情况 : 

(1) 车 结 点 是 叶子 结 点 ,直接 删 去 该 结 点 。 如 图 9. 12(a) 所 示 , 直 接 删 除 结 点 9。 这 
是 最 简单 的 删除 结 点 的 情况 。 

(2) 车 pp 结 点 只 有 左 子 树 而 无 右 子 树 。 根 据 二 又 排 序 树 的 特点 ,可 以 直接 将 其 左 孩 子 
替代 结 点 p( 结 点 替换 )。 如 图 9. 12(b) 所 示 ,p 指向 结 点 4, 要 删除 p 结 点 ,只 需 将 其 左 孩 子 
结 点 3 替代 它 。 

(3) 若 户 结 点 只 有 右 子 树 而 无 左 子 树 。 根 据 二 又 排序 树 的 特点 ,可 以 直接 将 其 右 孩 子 
替代 结 点 p( 结 点 蔡 换 )。 如 图 9. 12(c) 所 示 ,p 指向 结 点 7, 要 删除 户 结 点 ,只 需 将 其 右 孩 子 
结 点 8 替代 它 。 

(4) 若 户 结 点 同时 存在 左 , 右 子 树 。 根 据 二 又 排序 树 的 特点 ,可 以 从 其 左 子 树 中 选择 关 
键 字 最 大 的 结 点 7, 用 结 点 7 的 值 替 代 结 点 p 的 值 ( 结 点 值 蔡 换 ) ,并 删除 结 点 r( 由 于 7 结 点 
一 定 是 没有 右 子 树 的 ,删除 它 属于 情况 (2)) ,其 原理 是 用 中 序 前 驱 替 代 被 删 结 点 。 

也 可 以 从 其 右 子 树 中 选择 关键 字 最 小 的 结 点 +, 用 结 点 7 的 值 蔡 代 结 点 p 的 值 ( 结 点 值 
替换 ) ,而 且 将 它 删 除 (由 于 7 结 点 一 定 是 没有 左 子 树 的 ,删除 它 属于 情况 (3)), 其 原理 是 用 
中 序 后 继 蔡 代 被 删 结 点 。 

通常 采用 前 一 种 删除 方式 ,如 图 9.12(d) 所 示 ,p 指向 结 点 5, 它 的 左 子 树 中 关键 字 最 大 
的 结 点 是 结 点 4, 将 结 点 p 的 关键 字 改 为 4, 并 删除 结 点 4。 

那么 如 何 实现 二 又 排序 树 删 除 结 点 的 算法 呢 ? 下 面 以 删除 只 有 右 子 树 的 结 点 p 为 例 
进行 说 明 。 首 先 要 查找 关键 字 为 k 的 被 删 结 点 p ,其 算法 如 下 : 




















bool deletek(BSTNode * & bt,KeyType k) 
{ 站 (bt!=NULL) 


{ if (k==bt—> key) // 查 找到 了 被 删 结 点 bt 
{ deletep(bt) // 调 用 deletep 删除 结 点 bt 
return true; // 成 功 删除 ,返回 真 


} 
else if (k<bt 一 > key) 
deletek( bt 一 > lchild,k); // 在 左 子 树 中 查找 
else 
deletek(bt -> rchild,k); ”// 在 右 子 树 中 查找 
} 
else return false; // 未 查找 到 ,返回 假 
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(a) 删除 叶子 结 点 


Cs) (5) 
OO ORG 
GO 全 器 删除 结 上 (3) CC 
Gj (5) 
©) (9) 


(b) 被 出 结 点 右 子 树 为 空 


() (9) 
(2 yp ORG 
@) (4) (7) 删除 结 点 7 @) (4) (8) 
©) (2 © ©) 
(©) 
p 


(©) 被 剧 结 点 左 子 树 为 空 






删除 结 点 5 CD) (3) (7) 


(d) 被 删 结 点 左 、 右 子 树 均 不 为 空 

图 9.12 二 叉 排序 树 的 结 点 删除 
删除 结 点 p( 这 里 的 结 点 p 仅仅 有 右 子 树 ) 的 算法 如 下 : 
void deletep( BSTNode * &p) 
{ BSTNode *q; 


q 一 p; // 让 aq 指向 结 点 p 
p=p—> rchild; // 让 p 指向 它 的 右 孩子 
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free(q) ; // 释 放 结 点 q 的 空间 
} 


对 于 图 9. 9 所 示 的 最 终 的 二 叉 排序 树 bt, 调 用 deletek(bt,1) 函 数 删除 关键 字 为 1 的 结 
点 的 过 程 如 图 9.13 所 示 。 从 中 可 以 看 出 ,由 于 deletep 函数 中 的 形 参 p 是 引用 型 参数 , 当 执 
行 deletep 函数 让 p 指向 其 右 孩 子 后 ,通过 函数 返回 将 p 回 传 给 实 参 达到 删除 原来 p 所 指 
结 点 的 目的 。 其 中 引用 型 参数 p 起 到 关键 作用 ,使 得 删除 结 点 p 不 必 查 找 其 双亲 结 点 。 后 
面 的 删除 算法 都 是 利用 这 种 方法 实现 的 。 





deletek(bt, 1) 








deletek(bt!，1) 





1 
1 
各 1 
1<bt->key(3) | bt->lehild=bti=p 一 一 | p 
和 
1 
1 
| 


最 终 的 结果 , 删除 了 结 点 1 





1 

1 

1 

1 

1 

So— bt,=bt->Ichild bti=p( 让 bty 指 
0. 1 1=bt,->key(1) 向 结 点 2) 

1 

i 

1 

1 











deletep(p) 
| p=bti( 让 p 指 向 结 点 1) 








让 bt 指向 





图 9.13 在 二 叉 排序 树 bt 中 删除 关键 字 为 1 的 结 点 


删除 二 又 排序 树 bt 中 关键 字 为 的 结 点 的 算法 DeleteBST(bt.k) 如 下 : 


bool DeleteBST(BSTNode * &bt, KeyType k) // 在 bt 中 删除 关键 字 为 k 的 结 点 
和 if (bt==NULL) 
return false; // 空 树 删 除 失败 ,返回 假 
else 


{ if (k< bt 一 key) 
return DeleteBST(bt 一 lchild,k) ; // 递 归 在 左 子 树 中 删除 为 k 的 结 点 
else if (k> bt —> key) 
return DeleteBST(bt -> rchild, k); // 递 归 在 右 子 树 中 删除 为 k 的 结 点 


else // 找 到 了 要 删除 的 结 点 bt 

{ Delete(bb ; // 调 用 DeleteCbb 函数 删除 结 点 bt 
return true; // 删 除 成 功 ,返回 真 

} 


} 
注意 : 上 述 算 法 是 在 根 结 点 指针 为 bt 的 二 又 排序 树 中 删除 一 个 结 点 ,bt 的 值 可 能 发 生 


变化 ,所 以 一 定 要 用 引用 类 型 ,即将 bt 的 值 改变 后 的 结果 回 传 给 实 参 ,否则 可 能 会 出 现 
错误 。 
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void Delete(BSTNode * &p) 
{ BSTNode *q; 
if (p 一 rchild== NULL) 
0 
p=p—> lchild; 
free(q); 
} 
else if (p 一 lchild== NULL) 
sp 
p=p—> rchild; 
free(q); 
} 
else Deletel(p,p -> lchild) ; 
} 
void Deletel (BSTNode * p,BSTNode * &r) 
{ BSTNode *q; 
if (r—> rchild!=NULL) 
Deletel (p,r —> rchild) ; 
else 
{ p>key=r-—> key; 
p 一 data=r —> data; 
q=r; 
r=r—> lchild; 
free(q); 


932 平衡 二 又 树 


在 含有 个 结 点 的 二 叉 排序 树 中 查找 操作 的 执行 时 间 与 树 形 有 关 , 在 
最 坏 情 况 下 执行 时 间 为 O(0z) 。 为 了 避免 这 种 情况 发 生 , 人 们 研究 了 许多 种 
动态 平衡 的 方法 ,使 得 往 树 中 插入 或 删除 结 点 时 通过 调整 树 的 形态 来 保持 
树 的 “平衡 ”, 使 之 既 保持 BST 性 质 不 变 又 保证 树 的 高 度 在 任何 情况 下 均 为 O(logzn) ,从 而 
确保 树 上 的 查找 操作 在 最 坏 情况 下 的 时 间 也 是 O(logsn) 。 

平衡 的 二 叉 排 序 树 有 很 多 种 ,较为 著名 的 有 AVL 树 , 它 是 由 两 位 前 苏联 数学 家 Adel' 
son-Vel'sii 和 Landis 于 1962 年 给 出 的 , 故 用 他 们 的 名 字 命 名 。 下 面 讨论 的 平衡 二 又 树 都 指 


AVL 树 。 


若 一 棵 二 又 树 中 每 个 结 点 的 左右 子 树 的 高 度 最 多 相差 1, 则 称 此 二 叉 树 为 平衡 二 叉 树 
(balanced binary tree) 。 在 算法 中 ,通过 平衡 因子 (balance factor,bf) 来 具体 实现 上 述 平衡 
二 又 树 的 定义 。 一 个 结 点 的 平衡 因子 是 该 结 点 左 子 树 的 高 度 减 去 右 子 树 的 高 度 ( 或 者 该 结 


// 从 二 叉 排序 树 中 删除 结 点 p 
// 结 点 p 没有 右 子 树 ( 含 为 叶子 结 点 ) 的 情况 
// 用 结 点 p 的 左 孩子 替代 它 


// 结 点 没有 左 子 树 的 情况 
// 用 结 点 p 的 右 孩子 替代 它 


// 结 点 p 既 有 左 子 树 又 有 右 子 树 的 情况 
// 被 删 结 点 有 左右 子 树 ,r 指 向 其 左 孩子 
// 递 归 找 结 点 r 的 最 右 下 结 点 


// 找 到 了 最 右 下 结 点 r( 它 没有 右 子 树 ) 
// 将 结 点 + 的 值 存放 到 结 点 p 中 ( 结 点 值 替 代 ) 


// 删 除 结 点 
// 即 用 结 点 + 的 左 孩 子 替代 它 
// 释 放 结 点 q 的 空间 








视频 讲解 





点 右 子 树 的 高 度 减 去 左 子 树 的 高 度 )。 从 平衡 因子 的 角度 说 , 若 一 棵 二 叉 树 中 某 个 结 点 的 平 
衡 因 子 的 绝对 值 小 于 或 等 于 1, 即 其 平衡 因子 的 取 值 为 1.0 或 一 1, 该 结 点 是 平衡 的 ,否则 是 
不 平衡 的 。 若 一 棵 二 又 树 的 所 有 结 点 都 是 平衡 的 , 称 之 为 平衡 二 叉 树 。 

一 般 情 况 下 ,一 棵 平衡 二 又 树 总 是 二 又 排序 树 ,因为 脱离 二 叉 排序 树 来 讨论 平衡 二 又 树 
是 没有 意义 的 。 所 以 平衡 二 又 树 是 在 二 叉 排序 树 的 基础 上 增加 了 树 形 约束 , 即 每 个 结 点 是 








平衡 的 。 





数据 结构 教程 \ 目 GO 





图 9. 14 是 平衡 二 又 树 和 不 平衡 二 叉 树 的 例子 ,图 中 结 点 旁 标注 的 数字 为 该 结 点 的 平衡 
因子 。 其 中 ,图 9.14(a) 是 一 棵 平衡 二 叉 树 ,图 中 所 有 结 点 的 平衡 因子 的 绝对 值 都 小 于 1; 
图 9.14(b) 是 一 棵 非 平衡 二 叉 树 ,图 中 结 点 3、4、5 的 平衡 因子 的 值 分 别 为 一 2、 一 3 和 一 2, 它 
们 是 不 平衡 的 。 








(a) 一 棵 平衡 二 叉 树 (b) 一 棵 非 平衡 二 叉 树 
图 9.14 一 棵 平衡 二 叉 树 和 一 棵 非 平衡 二 叉 树 


那么 如 何 使 构造 的 二 叉 排 序 树 是 一 棵 平衡 二 叉 树 呢 ? 关键 是 每 次 向 二 又 排序 树 中 插入 
新 结 点 时 要 保持 所 有 结 点 满足 平衡 二 叉 树 的 要 求 。 这 就 要 求 一 旦 某 些 结 点 的 平衡 因子 在 插 
入 新 结 点 后 不 满足 要 求 就 要 进行 调整 。 要 -要 

在 平衡 二 文科 和 和 插 天 络 专 的 征程 

若 向 平衡 二 又 树 中 插入 一 个 新 结 点 (总 是 作为 叶子 结 点 插入 的 ) 后 破坏 
了 平衡 性 ,首先 从 该 新 插入 结 点 向 根 结 点 方向 查找 第 一 个 失去 平衡 的 结 点 ， 
然后 以 该 失衡 结 点 和 它 相 邻 的 刚 查 找 过 的 两 个 结 点 构成 调整 子 树 ,使 之 成 。 于 
为 新 的 平衡 子 树 。 当 失衡 的 最 小 子 树 被 调整 为 平衡 子 树 后 ,整个 树 就 又 成 为 一 棵 平衡 二 
又 树 。 

失衡 的 最 小 子 树 是 指 以 离 插 入 结 点 最 近 , 且 平衡 因子 绝对 值 大 于 1 的 结 点 作为 根 的 子 树 。 
假设 用 A 表示 失衡 的 最 小 子 树 的 根 结 点 , 则 调整 该 子 树 的 操作 可 归纳 为 下 列 4 种 情况 ， 

1) LL 型 调整 

这 是 因 在 A 结 点 的 左 孩 子 ( 设 为 B 结 点 ) 的 左 子 树 上 搬入 结 点 ,使 得 A 结 点 的 平衡 因子 
由 1 变 为 2 而 引起 的 不 平衡 。 

LL 型 调整 的 一 般 情 况 如 图 9. 15 所 示 。 在 图 中 ,用 长 方 框 表示 子 树 ,用 长 方 框 的 高 度 
(并 在 长 方 框 旁 标 有 高 度 值 姑 或 六 十 1) 表 示 子 树 的 高 度 , 用 带 阴影 的 小 方 框 表 示 被 插入 的 结 
点 。 调 整 的 方法 是 将 B 结 点 向 上 升 替 代 A 结 点 成 为 根 结 点 ,A 结 点 作为 B 结 点 的 右 孩 子 ， 
而 B 的 原 右 子 树 8 作 为 A 结 点 的 左 子 树 。 因 调整 前 后 对 应 的 中 序 序列 相同 ,所 以 调整 后 仍 
保持 了 二 又 排序 树 的 性 质 不 变 ,但 变 为 平衡 二 又 树 了 。 

2) RR 型 调整 

这 是 因 在 A 结 点 的 右 孩 子 ( 设 为 了 B 结 点 ) 的 右 子 树 上 插入 结 点 ,使 得 A 结 点 的 平衡 因子 
由 一 1 变 为 一 2 而 引起 的 不 平衡 。 

RR 型 调整 的 一 般 情况 如 图 9. 16 所 示 。 调 整 的 方法 是 将 B 结 点 向 上 升 替 代 A 结 点 成 
为 根 结 点 ,A 结 点 作为 B 结 点 的 左 孩 子 ,而 B 的 原 左 子 树 8 作为 A 结 点 的 右 子 树 。 实 际 上 
RR 型 调整 和 LL 型 调整 是 对 称 的 。 
































































































插入 前 插入 后 调整 后 
图 9.15 LL 型 调整 的 过 程 





















































插入 前 插入 后 调整 后 
图 9.16 RR 型 调整 的 过 程 


3) LR 型 调整 

这 是 因 在 A 结 点 的 左 孩子 ( 设 为 了 B 结 点 ) 的 右 子 树 上 插入 结 点 ,使 得 A 结 点 的 平衡 因子 
由 1 变 为 2 而 引起 的 不 平衡 。 

LR 型 调整 的 一 般 情况 如 图 9. 17 所 示 。 调 整 的 方法 是 将 C 结 点 上 升 作为 根 结 点 ,B 结 
点 作为 C 结 点 的 左 孩 子 ,A 结 点 作为 C 结 点 的 右 孩 子 ,C 结 点 的 原 左 子 树 8 作为 B 结 点 的 
右 子 树 ,C 结 点 的 原 右 子 树 y 作为 A 结 点 的 左 子 树 。 

















ht+l 















































插入 前 插入 后 
9.17 LR 型 调整 的 过 程 


335 





数据 结构 教程 \ 目 GO 





4) RL 型 调整 

这 是 因 在 A 结 点 的 右 孩 子 ( 设 为 了 B 结 点 ) 的 左 子 树 上 插入 结 点 ,使 得 A 结 点 的 平衡 因子 
由 一 1 变 为 一 2 而 引起 的 不 平衡 。 

RL 型 调整 的 一 般 情 况 如 图 9. 18 所 示 。 调 整 的 方法 是 将 C 结 点 上 升 作 为 根 结 点 ,A 结 
点 作为 C 结 点 的 左 孩 子 ,B 结 点 作为 C 结 点 的 右 孩 子 ,C 结 点 的 原 左 子 树 8 作为 A 结 点 的 
右 子 树 ,C 结 点 的 原 右 子 树 y 作为 B 结 点 的 左 子 树 。 同 样 ,RL 型 调整 和 LR 型 调整 是 对 
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插入 前 插入 后 调整 后 


图 9.18 ”RL 型 调整 的 过 程 


【 例 9.5】 输入 关键 字 序 列 (16,3,7,11,9,26,18,14,15), 给 出 构造 一 棵 平衡 二 叉 树 的 
建立 平衡 二 叉 树 的 过 程 如 图 9. 19 所 示 , 图 9. 19(n) 是 最 终结 果 。 





(a) 插入 16 (b) 插入 3 (@) 插入 7 (d) LR 调 整 





(g) LL 调 整 (hb) 插入 26 (iD RR 调整 
图 9. 19 建立 平衡 二 叉 树 的 过 程 








(k) RL 调整 (0 插入 14 





(m) 插入 15 (n) LR 调整 
图 9.19 建立 平衡 二 叉 树 的 过 程 


2 和 

在 平衡 二 叉 树 中 删除 一 个 结 点 与 二 叉 排 序 树 中 删除 结 点 类 似 , 只 是 增加 了 调整 这 一 步 
又 。 其 过 程 如 下 : 村 

(1) 查找 。 先 在 平衡 二 又 树 中 查找 到 关键 字 为 的 结 点 p 。 

(2) 删除 。 删 除 p 结 点 分 以 下 几 种 情况 。 

@ 叶子 结 点 : 直接 删除 该 结 点 。 ds 

@ 单 分 支 结 点 : 用 p 结 点 的 左 或 右 孩 子 结 点 替代 pp 结 点 ( 结 点 替换 ) 。 视频 讲解 

@ 双 分 支 结 点 : 用 p 结 点 的 中 序 前 驱 ( 或 中 序 后 继 ) 结 点 g 的 值 替换 p 结 点 的 值 。 再 
删除 结 点 gq。 

(3) 调 整 。 若 被 删除 的 是 结 点 g, 则 从 结 点 g 向 根 结 点 方向 查找 第 一 个 失去 平衡 的 结 点 : 

@ 若 所 有 结 点 都 是 平衡 的 , 则 不 需要 调整 。 

@ 假设 找到 某 个 结 点 的 平衡 因子 为 一 2: 其 右 孩 子 的 平衡 因子 是 一 1, 则 作 RR 型 调整 ; 其 右 
孩子 的 平衡 因子 是 1, 则 作 RL 型 调整 ; 其 右 孩 子 的 平衡 因子 是 0, 则 作 RR 或 RL 型 调整 均 可 。 

@ 假设 找到 某 个 结 点 的 平衡 因子 为 2: 其 左 孩 子 的 平衡 因子 是 一 1, 则 作 LR 型 调整 ; 其 右 
孩子 的 平衡 因子 是 1, 则 作 LL 型 调整 ; 其 右 孩 子 的 平衡 因子 是 0, 则 作 LR 或 LL 型 调整 均 可 。 

【 例 9.6】 对 例 9. 5 生成 的 AVL 树 给 出 依次 删除 结 点 11、9 和 15 的 步骤 。 

删除 结 点 的 过 程 如 图 9. 20 所 示 。 图 9. 20(a) 为 初始 AVL 树 ,删除 结 点 11( 为 根 结 
点 ) 时 先 从 其 左 子 树 中 找到 最 大 结 点 9, 用 其 值 蔡 代 被 删 结 点 的 值 ,删除 原 结 点 9。 修 改 原 结 
点 9 的 双亲 结 点 7 的 平衡 因子 为 1, 再 向 上 找到 根 结 点 ,都 是 平衡 的 。 删 除 后 的 结果 如 
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图 9. 20(b) 所 示 。 





(d) RL 调 整 (e) 删除 结 点 15 
图 9.20 删除 AVL 中 结 点 的 过 程 


删除 结 点 9( 为 根 结 点 ) 时 先 从 其 左 子 树 中 找到 最 大 结 点 7, 用 其 值 蔡 代 被 删 结 点 的 值 ， 
删除 结 点 7。 修 改 原 结 点 7 的 双亲 结 点 的 平衡 因子 为 一 2, 不 平衡 ,找到 其 右 孩 子 结 点 18, 它 
的 平衡 因子 为 1 ,进行 RL 调整 。 删 除 后 的 结果 如 图 9. 20(d) 所 示 。 

删除 结 点 15( 为 根 结 点 ) 时 先 从 其 左 子 树 中 找到 最 大 结 点 14, 用 其 值 替代 被 删 结 点 的 
值 ,删除 结 点 14。 修 改 原 结 点 14 的 双亲 结 点 7 的 平衡 因子 为 1, 再 向 上 找到 根 结 点 ,都 是 平 
衡 的 。 删 除 后 的 结果 如 图 9. 20(e) 所 示 。 

3 平衡 二 注 树 的 砍 找 扫 -- 扫 

平衡 二 又 树 查 找 过 程 和 二 叉 排 序 树 查 找 过 程 完全 相同 ,因此 ,在 平衡 二 I 
叉 树 上 查找 的 关键 字 比 较 次 数 不 会 超过 其 高 度 。 

在 最 坏 情 况 下 ,普通 二 叉 排序 树 的 查找 性 能 为 O(n)。 那 么 .平衡 二 又 树 bE 
的 情况 又 是 怎样 的 呢 ?” 下 面 分 析 平 衡 二 叉 树 的 高 度 hh 和 结 点 个 数 n 之 间 的 视频 讲解 

首先 构造 一 系列 的 平衡 二 叉 树 Ti ,Ts ,Ts ,…, 其 中 T, (h 二 1,2,3,…) 是 高 度 为 且 结 
点 数 尽 可 能 少 的 平衡 二 叉 树 ,如 图 9. 21 中 所 示 的 TI、T。、Ts 和 T,。 为 了 构造 六 , 先 分 别 构 














也 


5 闪闪 向 


9.21 ”高度 为 h 结 点 个 数 n 最 少 的 平衡 二 又 树 
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造 Ti1 和 T;-s, 使 T 以 T,-1 和 T;-, 作 为 其 根 结 点 的 左右 子 树 。 对 于 每 一 个 T; ,只 要 从 
中 删 去 一 个 结 点 ,就 会 失去 平衡 或 高 度 不 再 是 (显然 ,这 样 构 造 的 平衡 二 又 树 在 结 点 个 数 
相同 的 平衡 二 又 树 中 具有 最 大 高 度 ) 。 

然后 通过 计算 上 述 平衡 二 叉 树 中 的 结 点 个 数 来 建立 高 度 与 结 点 个 数 之 间 的 关系 。 设 
N(h) (高 度 / 是 正 整数 ) 为 Th 的 结 点 数 ,从 图 9. 21 中 可 以 看 出 有 下 列 关 系 成 立 

N(1)= 1,N(2) = 2,N(h) 三 NO 一 1) 十 NG 一 2) 十 1 
当 有 >1 时 ,此 关系 类 似 于 定义 Fibonacci 数 的 关系 : 
F(1) = 1,F(2) = 1,F(h) = F(h—1)+F(h—2) 
通过 检查 两 个 序列 的 前 几 项 就 可 以 发 现 两 者 之 间 的 对 应 关系 : 
N(h) = F(h+2)—1 
由 于 Fibonacci 数 满足 渐 近 公式 : 


1 1 十 
F( = 二 yr'， 其 中 p= 
万 9 9 2 


四 1 
得 近似 公式 : Ni) 三 一 ppt 一 1s24 一 ] 
故 由 此 可 得 近似 公式 9 














司 





即 : hologs (NGC 十 1) 

所 以 ,含有 个 结 点 的 平衡 二 叉 树 的 平均 查找 长 度 为 O(logsn) ,对 应 查找 算法 的 时 间 
复杂 度 为 O(logsn) 。 实 际 上 , 折 半 查找 对 应 的 判断 树 就 是 一 棵 平衡 的 二 又 排序 树 (平衡 二 
又 树 ) ,所 以 折 半 查找 算法 的 时 间 复 杂 度 也 为 O(logs7) 。 


933 B 树 


二 又 排序 树 和 平衡 二 又 树 都 是 用 作 内 查找 的 数据 结构 , 即 被 查找 的 数 | 图 训 瑟 让 
据 集 不 大 ,可 以 放 在 内 存 中 。 本 小 节 和 后 面 小 节 介绍 的 B- 树 和 B 十 树 是 用 视频 讲解 
作 外 查找 的 数据 结构 ,其 中 的 数据 存放 在 外 存 中 。 

B- 树 (B tree) 中 所 有 结 点 的 孩子 结 点 的 最 大 值 称 为 B-_ 树 的 阶 ,通常 用 m 表示 ,从 查找 
效率 考虑 ,要 求 m 宇 3。 一 棵 mm 阶 B- 树 或 者 是 一 棵 空 树 , 或 者 是 满足 下 列 要 求 的 m 叉 树 : 

(1) 树 中 每 个 结 点 最 多 有 m 棵 子 树 ( 即 最 多 含有 mm 一 1 个 关键 字 , 设 Max 二 m 一 1); 

(2) 若 根 结 点 不 是 叶子 结 点 , 则 根 结 点 最 少 有 两 棵 子 树 ; 

(3) 除根 结 点 以 外 ,所 有 非 叶 子 结 点 最 少 有 [xm/2 | 棵 子 树 ( 即 最 少 含 有 [「 /2 | 一 1 个 关 
键 字 , 设 Min=[m/2 | 一 1); 

(4) 每 个 结 点 的 结构 为 : 


















































n po kl pi ks p: A k, 加 








其 中 ,n 为 该 结 点 中 的 关键 字 个 数 , 除 根 结 点 以 外 ,其 他 所 有 结 点 的 关键 字 个 数 n 满足 
[m/2 | 一 1<n 志 mm 一 1; ki(1 二 in) 为 该 结 点 的 关键 字 且 满足 二 kt1; pi(0 志 i<n) 为 该 结 
点 的 孩子 结 点 指针 ,满足 p;(0 三 i 二 n 一 1) 所 指 子 树 上 结 点 的 关键 字 均 大 于 且 小 于 Rin; 
pa 所 指 子 树 上 结 点 的 关键 字 均 大 于 A,。 

(5) 所 有 的 外 部 结 点 在 同一 层 , 并 且 不 带 信息 。 

在 B- 树 中 外 部 结 点 (可 以 看 作 是 查找 失败 的 结 点 ,实际 上 这 些 结 点 不 存在 ,指向 这 些 结 
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点 的 指针 为 空 ) 不 带 信息 ,为 了 方便 ,在 后 面 的 B- 树 图 中 都 没有 画 出 外 部 结 点 层 。 通 常 在 计 
算 一 棵 B_- 树 的 高 度 时 外 部 结 点 层 也 要 计 和 人 一 层 。 显 然 , 如 果 一 棵 B- 树 中 总 共有 ?7 个 关键 
字 , 则 外 部 结 点 的 个 数 为 xz 十 1 。 

例如 ,图 9.22 是 一 棵 3 阶 B_ 树 ,m 二 3。 它 满足 : 

(1) 每 个 结 点 的 孩子 个 数 小 于 等 于 3; 

(2) 除根 结 点 以 外 ,其 他 结 点 最 少 有 | wz/2 | 二 2 个 孩子 ; 

(3) 根 结 点 有 两 个 孩子 结 点 

(4) 除根 结 点 以 外 的 所 有 结 点 的 关键 字 个 数 nn 大 于 等 于 [m/2 |] 一 1=1, 小 于 等 于 
m—1=2; 

(5) 所 有 外 部 结 点 都 在 同一 层 上 , 树 中 总 共有 17 个 关键 字 , 外 部 结 点 有 18 个 。 
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图 9.22 一 棵 3 阶 B- 树 
































在 B- 树 的 存储 结构 中 , 结 点 的 类 型 声明 如 下 : 


#define MAXM 10 // 定 义 B- 树 的 最 大 阶 数 
typedef int KeyType; //KeyType 为 关键 字 类 型 
typedef struct node 
{ int keynum; // 结 点 当前 拥有 的 关键 字 的 个 数 
KeyType key [MAXM] ; //key[1..keynum] 存 放 关 键 字 ,key[0] 不 用 
struct node * parent; // 双 亲 结 点 指针 
struct node * ptrLMAXM] ; ”// 孩 子 结 点 指针 数组 ptr[0..keynum] 
} BTNode; //B- 树 结 点 类 型 
int m; //m 阶 B- 树 ,这 里 的 m、Max 和 Min 几 个 变量 均 定义 为 全 局 
变量 
int Max; //m 阶 B- 树 中 每 个 结 点 的 最 多 关键 字 个 数 , Max 一 m 一 1 
int Min; //m 阶 B- 树 中 每 个 结 点 的 最 少 关 键 字 个 数 , Min 一 | m/2 | 一 1 


在 B- 树 中 查找 给 定 关键 字 的 方法 类 似 于 二 又 排序 树 上 的 查找 ,不 同 的 
是 在 每 个 结 点 上 确定 向 下 查找 的 路 径 不 一 定 是 二 路 的 ,而 是 z 十 1 路 的 。 因 
为 结 点 内 的 关键 字 序 列 key[1..nj] 是 有 序 的 , 故 既 可 以 用 顺序 查找 也 可 以 用 
折 半 查找 。 在 一 棵 B- 树 上 查找 关键 字 为 & 的 方法 为 : 将 与 根 结 点 中 的 
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key[i 让 (1 委 i 委 2) 进行 比较 

(1) 车 二 key[1], 则 沿 着 指针 ptr[0] 所 指 的 子 树 继续 查找 ; 

(2) 车 二 key[ 门 , 则 查找 成 功 ; 

(3) 车 key[ 门 过 k 过 key[i 十 1], 则 沿 着 指针 ptr[ 让 所 指 的 子 树 继续 查找 ; 

(4) 车 记 key[nj], 则 沿 着 指针 ptr[n] 所 指 的 子 树 继续 查找 。 

重复 上 述 过 程 ,直到 找到 含有 关键 字 的 某 个 结 点 ; 如 果 一 直 比 较 到 了 某 个 外 部 结 点 ， 
表示 查找 失败 。 

在 B- 树 中 进行 查找 时 ,其 查找 时 间 主 要 花费 在 搜索 结 点 上 , 即 主要 取决 于 B- 树 的 高 
度 。 那 么 总 共 含 有 nn 个 关键 字 的 mm 阶 B- 树 可 能 达到 的 最 大 高 度 为 多 少 呢 ? 或 者 说 ,高 度 
为 h 十 1( 第 hh 十 1 层 为 外 部 结 点 层 ) 的 B- 树 中 最 少 含有 多 少 个 结 点 ? 

第 1 层 最少 结 点 数 为 1 个 ; 

第 2 层 最少 结 点 数 为 两 个 ; 

第 3 层 最 少 结 点 数 为 2[m/2 | 个; 

第 4 层 最 少 结 点 数 为 2[ /2 | 个; 


第 /十 1 层 最 少 结 点 数 为 2[m/2 1] 一: 个。 
假设 m 阶 B_ 树 的 高 度 为 十 1, 由 于 第 有 十 1 层 为 外 部 结 点 ,而 当前 树 中 含有 nn 个 关键 
字 , 则 外 部 结 点 为 a 十 1 个 ,由 此 可 推 得 下 列 结果 : 
n 二 1 宇 2[m/21 1, 即 hh 一 1 和 < logrwa1(n 二 1)/2) 
所 以 h 生 logrFw1 Cn 十 1)/2 十 1, 因 此 在 合 n 个 关键 字 的 B- 树 上 进行 查找 需 访 问 的 结 点 个 数 
不 超过 logFwz1 Cn 十 1)/2 十 1 个 , 即 B- 树 查找 算法 的 时 间 复 杂 度 为 O(logwz ) 。 


将 关键 字 k 插入 到 B_ 树 的 过 程 分 两 步 完 成 : 

(1) 利用 前 述 的 B_ 树 的 查找 算法 找 出 关键 字 & 的 插入 结 点 (注意 ， 
B_ 树 的 插入 结 点 一 定 是 某 个 叶子 结 点 )。 E 

(2) 在 插入 结 点 中 插入 关键 字 k, 判 断 插入 结 点 是 否 还 有 空位 置 , 即 判 。 如 闭 
断 该 结 点 的 关键 字 个 数 是 否 小 于 Max 一 六 一 1, 分 两 种 情况 ， 

Q@ 若 插入 结 点 的 关键 字 个 数 < Max, 说 明 该 结 点 还 有 空位 置 ,直接 把 关键 字 k 插入 到 该 
结 点 的 合适 位 置 上 ( 即 满足 插入 后 结 点 上 的 关键 字 仍 保持 有 序 ) 。 

@ 若 插入 结 点 的 关键 字 个 数 = Max, 说 明 该 结 点 已 没有 空位 置 , 需 要 把 结 点 分 裂 成 两 
个 。 分 裂 的 做 法 是 创建 一 个 新 结 点 ,把 原 结 点 上 的 关键 字 和 上 按 升序 排序 后 从 中 间 位 置 ( 即 
[m/2 | 之 处 ) 把 关键 字 ( 不 包括 中 间 位 置 的 关键 字 ) 分 成 两 部 分 , 左 部 分 所 含 关键 字 放 在 旧 结 




















点 中 , 右 部 分 所 含 关键 字 放 在 新 结 点 中 ,中 间 位 置 的 关键 字 连 同 新 结 点 的 存储 位 置 插 和 人 到 双 a 


亲 结 点 中 。 如 果 双 亲 结 点 的 关键 字 个 数 也 超过 Max, 则 要 再 分 裂 , 再 往 上 插 , 直 到 这 个 过 程 
传递 到 根 结 点 为 止 。 如 果 根 结 点 需要 分 裂 , 树 的 高 度 增加 一 层 。 

一 棵 B- 树 的 创建 过 程 就 是 从 一 棵 空 树 开 始 ,逐个 插入 关键 字 而 得 到 的 。 

【 例 9.7】 关键 字 序 列 为 (1,2,6,7,11,4,8,13,10,5,17,9,16,20,3,12,14,18,19， 
15) ,创建 一 棵 5 阶 B- 树 。 
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(a) 插入 1,2,6,7 (b) 插入 11 (c) 插入 4. 8, 13 (d) 插入 10 











1245 789||11131617 1245 || 789 ||1113||1720 






































(e) 插入 5, 17, 9, 16 (1) 插 入 20 
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(g) 插入 3, 12, 14, 18, 19 (h) 插入 15 
图 9.23 创建 一 棵 5 阶 B- 树 的 过 程 


1718 19 20 


由 于 m= 二 5, 所 以 Max 二 m 一 1 二 4。 以 在 图 9. 23(e) 中 插入 关键 字 20 为 例 说 明 搬 人 过 
程 。 在 图 9. 23(e) 中 插入 关键 字 20 时 ,查找 其 插入 结 点 是 最 右边 的 叶子 结 点 ,将 其 有 序 插 
入 ,该 结 点 变 成 (11,13,16,17,20) ,这 时 结 点 的 关键 字 个 数 超 界 , 需 进行 分 裂 , 即 由 该 结 点 变 
成 两 个 结 点 ,分 别 包 含 关键 字 11,13 和 17,20, 并 将 中 间 关 键 字 16 移 至 双亲 结 点 中 ,双亲 结 
点 变 为 (6,10,16)。 

再 看 在 图 9.23(g) 中 插入 关键 字 15 ,查找 其 插入 结 点 是 (11,12,13,14) 结 点 ,将 其 有 序 
插入 ,该 结 点 变 成 11,12,13,14,15), 这 时 该 结 点 的 关键 字 个 数 超 界 , 需 进行 分 裂 , 对 应 两 个 
结 点 (11,12) 和 (14,15) ,并 将 中 间 关 键 字 13 移 至 双亲 结 点 中 ,双亲 结 点 变 为 (3,6,10,13,16)。 
这 时 该 结 点 的 关键 字 个 数 超 界 , 需 进行 分 裂 , 对 应 两 个 结 点 (3,.6) 和 (13,16) ,并 将 中 间 关 键 
字 10 移 至 双亲 结 点 中 ,由 于 分 裂 前 的 结 点 就 是 根 结 点 ,所 以 新 建 一 个 根 结 点 , 树 的 高 度 增加 
一 层 。 最 终 创 建 的 5 阶 B_ 树 如 图 9.23(h) 所 示 。 扫 -- 扫 


3 8 树 的 删除 

B_ 树 的 删除 过 程 与 持 入 过 程 类 似 ,只 是 稍微 复杂 一 些 。 在 B_ 树 上 删 
除 关键 字 上 的 过 程 分 两 步 完成 : 

(1) 利用 前 述 的 B_ 树 的 查找 算法 找 出 该 关键 字 所 在 的 结 点 , 称 为 删除 。 并 

















(2) 删除 结 点 分 两 种 情况 : 一 种 是 属于 叶子 结 点 层 的 结 点 ; 另 一 种 是 属于 非 叶 子 结 点 
层 的 结 点 。 
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(3) 当 删 除 结 点 是 非 叶子 结 点 层 的 结 点 时 ,假设 要 删除 某 个 非 叶子 结 点 的 关键 字 4 一 
key[ 可 ,其 删除 过 程 是 用 该 结 点 ptr[i 一 1] 所 指 子 树 中 的 最 大 关键 字 key[max] 来 蔡 代 被 删 
关键 字 key[ 计 (注意 ptr[i 一 1] 所 指 子 树 中 的 最 大 关键 字 keyLmaxj 一 定 是 在 某 个 叶子 结 点 
上 ) ,然后 再 删除 keyLmax]。 这 样 也 就 把 在 非 叶子 结 点 上 删除 关键 字 & 的 问题 转化 成 了 在 
叶子 结 点 上 删除 关键 字 keyLmaxj] 的 问题 。 

例如 ,图 9.24(a) 是 一 棵 5 阶 B- 树 ,Min 王 2。 现 在 要 删除 关键 字 13 ,找到 它 所 在 的 结 
点 (13,16) 是 一 个 非 叶 子 结 点 ,在 其 左边 的 子 树 中 找到 该 子 树 的 最 大 关键 字 为 12, 它 在 (10， 
11,12) 的 叶子 结 点 中 ,用 12 替代 13 ,然后 再 删除 关键 字 12, 如 图 9. 24(b) 所 示 。 



















































































删除 关键 字 13 
12 45 78 101112|| 1516|| 1920 12 45 78 101103 15 16 || 19 20 
(a) 一 棵 3 阶 B- 树 (b) 转换 为 删除 关键 字 12 


图 9.24 将 非 叶子 结 点 层 的 删除 转换 为 叶子 结 点 层 的 删除 


也 可 以 用 删除 结 点 ptr[ 疏 所 指 子 树 中 的 最 小 关键 字 key[min] 来 蔡 代 被 删 关 键 字 key[ 门 
(同样 ,ptr[ 门 所 指 子 树 中 的 最 小 关键 字 key[min] 一 定 是 在 某 个 叶子 结 点 上 ) ,然后 再 删除 
keyLmin |。 

(4) 在 某 个 叶子 结 点 中 删除 关键 字 k, 共 有 以 下 3 种 情况 : 

@ 若 删除 结 点 的 关键 字 个 数 定 Min(| mm/2 | 一 1) ,说明 删 去 该 关键 字 后 该 结 点 仍 满足 
B- 树 的 定义 , 则 可 直接 删 去 该 关键 字 。 

@ 假如 删除 结 点 的 关键 字 个 数 =Min, 先 删除 这 个 关键 字 ,该 结 点 不 再 满足 B- 树 的 
要 求 , 此 时 若 该 结 点 的 左 (或 右 ) 兄 弟 结 点 中 关键 字 个 数 大 于 Min, 则 把 该 结 点 的 左 (或 右 ) 兄 
弟 结 点 中 最 大 (或 最 小 ) 的 关键 字 上 移 到 双亲 结 点 中 ,同时 把 双亲 结 点 中 大 于 (或 小 于 ) 上 移 
关键 字 的 那个 关键 字 下 移 到 要 删除 关键 字 的 结 点 中 。 

例如 ,图 9.25(a) 是 一 棵 5 阶 B_ 树 ,Min 二 2。 现 在 要 删除 关键 字 15 ,找到 它 所 在 的 结 
点 (14,15) 是 一 个 叶子 结 点 , 先 删 除 关键 字 15 ,再 向 右 兄 弟 借 一 个 关键 字 , 其 过 程 是 把 右 兄 
弟 (18,19,20) 中 的 最 小 关键 字 18 上 移 到 双亲 结 点 中 ,同时 把 双亲 结 点 中 的 关键 字 17 下 移 
到 该 结 点 中 ,如 图 9.25(b) 所 示 。 


民 们 六 13 18& 
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(a) 一 棵 3 阶 B- 树 (b) 删除 后 的 结 
9.25 删除 关键 字 15 的 过 程 ( 右 兄 弟 可 借 ) 


@ 假如 删除 结 点 的 关键 字 个 数 王 Min, 先 删除 这 个 关键 字 ,该 结 点 不 再 满足 B- 树 的 
要 求 ,并 且 该 结 点 的 左 和 右 兄 弟 结 点 (如 果 存 在 ) 中 的 关键 字 个 数 均 为 Min, 这 时 需要 结 点 合 
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并 ,把 要 删除 关键 字 的 结 点 与 其 左 ( 或 右 ) 兄 弟 结 点 以 及 双亲 结 点 中 分 割 二 者 的 关键 字 合 
成 一 个 结 点 。 如 果 因 此 使 双亲 结 点 中 的 关键 字 个 数 < Min, 则 对 此 双亲 结 点 做 同样 处 理 ,以 
至 于 可 能 直到 对 根 结 点 做 这 样 的 处 理 而 使 整个 树 减少 一 层 。 

例如 ,图 9.26(a) 是 一 棵 5 阶 B_ 树 ,Min 王 2。 现 在 要 删除 关键 字 15 ,找到 它 所 在 的 结 
点 (14,15) 是 一 个 叶子 结 点 , 先 删除 关键 字 15, 左 、 右 兄弟 都 不 能 借 ,需要 合并 ,其 过 程 是 把 
右 兄 弟 (18,19)、 双 亲 结 点 中 分 割 的 关键 字 17 和 该 结 点 合并 为 一 个 结 点 ,如 图 9. 26 (b) 
所 示 。 
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人) 一 棵 3 阶 B_ 树 (b) 删除 后 的 结果 


图 9.26 删除 关键 字 15 的 过 程 ( 左 、 右 兄弟 不 能 借 ) 


【 例 9.8】 对 于 例 9.7 生成 的 B- 树 ,给 出 删除 8、16、15 和 4 共 4 个 关键 字 的 过 程 。 
图 9. 27 说 明了 删除 的 过 程 ,这 里 Min 二 2。 以 在 图 9. 27(c) 中 删除 关键 字 4 的 过 程 
进行 说 明 。 




































































































































































二 pa 2 
12||45||789 |l1112||1415||17181920 12 || 45 79 | li12| li41s 181920] 
(a) 初始 5 阶 B_ 树 (b) 删除 8, 16 后 的 结果 
加 

36 13 18 
12 || 45 || 79 ||1112||1417| |1920 1235 ||79||1112| |1417| |1920 
(©) 删除 15 后 的 结果 (d) 删除 4 后 的 结 


9.27 一 棵 5 阶 B- 树 删除 8、16、15 和 4 关键 字 的 过 程 


在 图 9. 27(c) 中 删除 关键 字 4 时 ,找到 它 所 在 的 结 点 (4,.5) 是 一 个 叶子 结 点 ,从 中 删 
除 关 键 字 4, 而 左 、 右 兄弟 都 只 有 两 个 关键 字 , 不 能 借 , 将 左 兄弟 (1,2) 、 双 亲 结 点 中 分 割 的 
关键 字 3 和 该 结 点 合并 为 一 个 结 点 (1,2,3,5) ,这 样 双 亲 结 点 变 为 (6) ,不 满足 5 阶 B- 树 
的 要 求 。 

而 双亲 结 点 (6) 又 没有 兄弟 可 以 借 , 继 续 合 并 ,将 右 兄弟 (13,18) 、 双 亲 结 点 中 分 割 的 关 
键 字 10 和 该 结 点 合并 为 一 个 结 点 (6,10,13,18) ,这 样 导致 B_ 树 的 高 度 减少 了 一 层 。 


@00,S | 





934 B+ 树 
在 索引 文件 组 织 中 经 常 使 用 B- 树 的 一 些 变形 ,其 中 B 十 树 (B 十 tree) 是 一 种 应 用 广泛 
的 变形 。 一 棵 mm 阶 B 十 树 满足 下 列 条 件 : 扫 -- 扫 





(1) 每 个 分 支 结 点 最 多 有 m 棵 子 树 。 

(2) 根 结 点 或 者 没有 子 树 ,或 者 最 少 有 两 棵 子 树 。 

(3) 除根 结 点 以 外 ,其 他 每 个 分 支 结 点 最 少 有 [ zz/2 | 棵 子 树 。 

(4) 有 nn 棵 子 树 的 结 点 及 个 关键 字 。 视频 讲解 

(5) 所 有 叶子 结 点 包含 全 部 关键 字 及 指向 相应 记录 的 指针 ,而 且 叶 子 结 点 按 关键 字 大 
小 顺序 链接 (可 以 把 每 个 叶子 结 点 看 成 是 一 个 基本 索引 块 , 它 的 指针 不 再 指向 另 一 级 索引 
块 , 而 是 直接 指向 数据 文件 中 的 记录 ) 。 

(6) 所 有 分 支 结 点 (可 看 成 是 索引 的 索引 ?中 仅 包 含 它 的 各 个 子 结 点 ( 即 下 级 索引 的 索 
引 块 ) 中 的 最 大 关键 字 及 指向 子 结 点 的 指针 。 

例如 ,图 9. 28 所 示 为 一 棵 4 阶 的 B 十 树 , 其 中 叶子 结 点 的 每 个 关键 字 下 面 的 指针 表示 
指向 对 应 记录 的 存储 位 置 。 通 常 在 B 十 树 上 有 两 个 头 指针 ,一 个 指向 根 结 点 ,这 里 为 root， 
另 一 个 指向 关键 字 最 小 的 叶子 结 点 ,这 里 为 sqt。 
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图 9.28 一 棵 4 阶 的 B 十 树 


注意 : m 阶 的 B 十 树 和 m 阶 的 B- 树 的 主要 差异 如 下 。 

(1) 在 B 十 树 中 ,具有 nn 个 关键 字 的 结 点 含有 nn 棵 子 树 , 即 每 个 关键 字 对 应 一 棵 子 树 ， 
而 在 B_ 树 中 ,具有 nn 个 关键 字 的 结 点 含有 (n 十 1) 棵 子 树 。 

(2) 在 B 十 树 中 ,除根 结 点 以 外 ,每 个 结 点 中 的 关键 字 个 数 n 的 取 值 范围 是 [m/2 | 三 








n 三 m, 根 结 点 nn 的 取 值 范 围 是 2 三 n 三 m; 而 在 B_ 树 中 ,除根 结 点 以 外 ,其 他 所 有 非 叶 子 结 Wm 


点 的 关键 字 个 数 n 有 |[m/2 | 一 1 三 n 三 m 一 1, 根 结 点 nn 的 取 值 范围 是 1 三 n 寺 m 一 1。 

(3) B 十 树 中 的 所 有 叶子 结 点 包含 了 全 部 关键 字 , 即 其 他 非 叶 子 结 点 中 的 关键 字 包 含 在 
叶子 结 点 中 ,而 在 B- 树 中 关键 字 是 不 重复 的 。 

(4) B 十 树 中 的 所 有 非 叶 子 结 点 仅 起 到 索引 的 作用 , 即 结 点 中 的 每 个 索引 项 只 含有 对 应 
子 树 的 最 大 关键 字 和 指向 该 子 树 的 指针 ,不 含有 该 关键 字 对 应 记录 的 存储 地 址 。 而 在 B_ 树 
中 ,每 个 关键 字 对 应 一 个 记录 的 存储 地 址 。 








PE 
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(5) 通常 在 B 十 树 上 有 两 个 头 指针 ,一 个 指向 根 结 点 , 另 一 个 指向 关键 字 最 小 的 叶子 结 
点 ,所 有 叶子 结 点 链接 成 一 个 不 定 长 的 线性 链表 。 所 以 ,B_ 树 只 能 进行 随机 查找 ,而 B 十 树 
可 以 进行 随机 查找 和 顺序 查找 。 

在 B 十 树 中 可 以 采用 两 种 查找 方式 ,一 种 是 直接 从 最 小 关键 字 开 始 进行 顺序 查找 (通过 
sqt 指针 查找 ) , 另 一 种 是 从 B 十 树 的 根 结 点 开始 进行 随机 查找 (通过 root 指针 查找 ) 。 这 种 
查找 方式 与 B- 树 的 查找 方法 相似 ,只 是 在 分 支 结 点 上 的 关键 字 与 查找 值 相 等 时 查找 并 不 结 
束 ,要 继续 查 到 叶子 结 点 为 止 , 此 时 若 查找 成 功 , 则 按 所 给 指针 取出 对 应 元 素 即 可 。 因 此 ,在 
B 十 树 中 不 管 查找 成 功 与 否 ,每 次 查找 都 是 经 过 了 一 条 从 根 结 点 到 叶子 结 点 的 路 径 。 


与 B_ 树 的 插入 操作 相似 ,B 十 树 的 插入 也 是 在 叶子 结 点 中 进行 的 , 当 插入 后 结 点 中 的 关键 
字 个 数 大 于 m 时 要 分 裂 成 两 个 结 点 ,它们 所 含 的 键 值 个 数 分 别 为 [Gn 十 DD/2 | 和 | (mx 十 1)/2 |] ， 
同时 要 使 得 它们 的 双亲 结 点 中 包含 有 这 两 个 结 点 的 最 大 关键 字 和 指向 它们 的 指针 。 若 双亲 
结 点 的 关键 字 个 数 大 于 mn, 应 继续 分 裂 , 依 此 类 推 。 


B 十 树 的 删除 也 是 在 叶子 结 点 中 进行 的 , 当 叶 子 结 点 中 的 最 大 关键 字 被 删除 时 ,分 支 结 
点 中 的 值 可 以 作为 “分 界 关键 字 ? 存 在 。 若 因 删 除 操作 而 使 结 点 中 的 关键 字 个 数 少 于 | /2 |， 
则 从 兄弟 结 点 中 调剂 关键 字 或 和 兄弟 结 点 合并 ,其 过 程 和 B- 树 相似 。 


哈 希 表 的 查找 站 


941 哈 希 表 的 基本 概念 - 


在 介绍 哈 希 表 之 前 先 看 一 个 示例 。 假 设 有 一 个 班 的 学 生 表 ,包含 20 个 学 
生 元 素 (n 二 20) ,每 个 学 生 元 素 包 含 学 号 和 姓名 数据 项 ,其 中 学 号 是 关键 字 ， 
全 部 元 素 是 按 学 号 无 序 排 列 的 。 由 于 是 同班 的 学 生 ,学 号 的 前 几 位 是 相同 
的 ,如 都 以 “201001” 开 头 , 后 3 位 是 序号 ,但 序号 并 非 是 连续 的 (可 能 有 学 生 转 学 等 造成 ) 。 
现在 要 设计 其 存储 结构 ,以 便 按 学 号 查找 。 

存储 学 生 表 的 最 简单 方法 是 采用 一 个 数组 存储 ,也 就 是 顺序 存储 结构 ,如 图 9. 29 所 示 。 
在 这 种 存储 方式 下 查找 学 号 为 201001025 的 学 生 的 姓名 只 能 顺序 查找 ,一 边 查找 一 边 进行 
学 号 的 比较 。 若 采用 从 前 向 后 的 顺序 查找 ,需要 比较 20 次 ,对 应 的 时 间 复 杂 度 为 O(n)。 即 
便 数据 是 按 学 号 有 序 的 ,采用 折 半 查找 对 应 的 时 间 复 杂 度 也 为 O(logzsn) 。 

现在 根据 数据 的 特点 设计 另外 一 种 存储 结构 ,同样 用 一 个 数组 存放 所 有 学 生 元 素 ,采用 
一 个 函数 /学 号 ) 王 学 号 一 201001001, 对 于 某 个 学 生 元 素 , 计 算出 其 学 号 的 函数 值 , 将 该 元 
素 存 放 在 数组 中 对 应 的 下 标 ( 地 址 ) 处 ,如 图 9. 30 所 示 。 从 中 可 以 看 出 ,数组 中 有 些 元 素 是 
空闲 的 (如 由 于 没有 201001002 学 号 的 元 素 , 数 组 下 标 1 的 元 素 空闲 ), 所 以 数组 大 小 m 一 
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学 号 姓名 

201001001 党 

201001004 | 地 四 

学 生 表 201001003 | 于 五 








201001005 刘 六 

















201001025 | 许 七 





地 址 0 1 2 3 a 19 


学 号 | 201001001 | 201001004 | 201001003 201001005 | sas 201001025 
姓名 张 三 李 四 王 五 刘 六 Se 许 七 


图 9. 29 学 生 表 的 顺序 存储 结构 




















定 要 大 于 n。 这 里 假设 m= 二 25, 数 组 下 标 为 0 一 24。 在 这 种 存储 方式 下 查找 学 号 为 
201001025 的 学 生 的 姓名 ,首先 计算 地 址 4 二 201001025 一 201001001 二 24, 然 后 与 数组 下 标 
24 处 的 学 号 比较 ,相等 ,返回 其 姓名 “ 许 七 ”, 对 应 的 时 间 复 杂 度 为 0(1)。 这 种 存储 结构 就 
是 哈 希 表 。 




















学 号 。 姓名 

201001001 = 

201001004 李 四 

学 生 表 201001003 EE 





201001005 刘 六 























201001025 主攻 
人 学 号 广 学 号 -201001001 
地 址 由 6 
0 1 2 3 i 24 希 
学 号 | 201001001 空闲 201001003 | 201001004 A 201001025 表 
姓名 张 三 空间 王 五 李 四 可 许 七 


























9.30 学 生 表 的 哈 希 存储 结构 


哈 希 表 (hash table) 又 称 散 列表 ,其 基本 思路 是 , 设 要 存储 的 元 素 个 数 为 ,设置 一 个 长 
度 为 mlm 三 nn) 的 连续 内 存单 元 ,以 每 个 元 素 的 关键 字 k; (0 二 in 一 1) 为 自 变 量 ,通过 一 个 
称 为 哈 希 函数 (hash function) 的 函数 h(k;) 把 k; 映射 为 内 存单 元 的 地 址 (或 下 标 )h(k;) ,并 
把 该 元 素 存 储 在 这 个 内 存单 元 中 ,h(k;) 也 称 为 哈 希 地 址 (hash address)。 把 如 此 构造 的 线 
性 表 存 储 结构 称 为 哈 希 表 。 

在 构建 哈 希 表 时 可 能 存在 这 样 的 问题 ,两 个 关键 字 k; 和 k;(i 隆 j) 有; 关 k;, 但 会 出 现 
有 (kk;) 三 h(k;) 的 情况 ,把 这 种 现象 叫 哈 希 冲突 (hash collisions)。 通 常 把 这 种 具有 不 同 关键 
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字 而 具有 相同 哈 希 地 址 的 元 素 称 为 同义词 (synonym) ,这 种 冲突 也 称 为 同义词 冲突 。 在 哈 
和 希 表 存储 结构 中 ,同义词 冲突 是 很 难 避 免 的 ,除非 关键 字 的 变化 区 间 小 于 等 于 哈 希 地 址 的 变 
化 区 间 ,而 这 种 情况 当 关键 字 取 值 不 连续 时 是 非常 浪费 存储 空间 的 。 通 常 的 实际 情况 是 关 
键 字 的 取 值 区 间 远 大 于 哈 希 地 址 的 变化 区 间 。 

归纳 起 来 , 当 一 组 数据 的 关键 字 与 存储 地 址 存在 某 种 映射 关系 时 ,如 图 9. 31 所 示 , 这 组 
数据 适合 于 采用 哈 希 表 存 储 。 

哈 希 地 址 

0 








. 地 
@ | xb | 站 


m-l 











2 个 元 素 尹 个 连续 的 存储 单元 
图 9.31 一 组 与 存储 地 址 存在 映射 关系 的 数据 


在 哈 希 表 中 ,虽然 冲突 很 难 避 免 , 但 发 生 冲 突 的 可 能 性 却 有 大 有 小 ,这 会 影响 哈 希 查找 
的 性 能 。 哈 希 查 找 性 能 主要 与 3 个 因素 有 关 : 

(1) 与 装填 因子 有 关 。 所 谓 装填 因子 (load factor) 是 指 喻 希 表 中 已 存 人 的 元 素数 与 喻 
希 地 址 空间 大 小 m 的 比值 , 即 a==n/m。a 越 小 ,冲突 的 可 能 性 就 越 小 ; 越 大 (最 大 可 取 1) , 冲 
突 的 可 能 性 就 越 大 。 这 很 容易 理解 ,因为 a 越 小 , 哈 希 表 中 空闲 单元 的 比例 就 越 大 ,所 以 待 
插入 元 素 和 已 插入 的 元 素 发 生 冲 突 的 可 能 性 就 越 小 ; 反之 ,a 越 大 , 喻 希 表 中 空闲 单元 的 比 
例 就 越 小 ,所 以 待 插入 元 素 和 已 插入 的 元 素 冲 突 的 可 能 性 就 越 大 。 另 一 方面 ,a 越 小 ,存储 
空间 的 利用 率 就 越 低 ; 反之 ,存储 空间 的 利用 率 也 就 越 高 。 为 了 既 兼顾 减少 冲突 的 发 生 , 又 
兼顾 提高 存储 空间 的 利用 率 这 两 个 方面 ,通常 使 最 终 的 a 控制 在 0.6 一 0. 9 的 范围 内 。 

(2) 与 所 采用 的 喻 希 函 数 有 关 。 若 喻 希 函 数 选择 得 当 , 就 可 以 使 喻 希 地 址 尽 可 能 均匀 
地 分 布 在 喻 希 地 址 空间 上 ,从 而 减少 冲突 的 发 生 ; 否则 ,车 喻 希 函 数 选择 不 当 , 就 可 能 使 哈 
希 地 址 集中 于 某 些 区 域 , 从 而 加 大 冲突 的 发 生 。 

(3) 当 出 现 喻 希 冲 突 时 需要 采取 解决 哈 希 冲突 的 方法 ,所 以 哈 希 查找 性 能 也 与 解决 冲 
突 的 方法 有 关 。 

从 图 9. 30 所 示 的 哈 希 表 看 出 ,对 于 预先 知道 且 规 模 不 大 的 关键 字 集合 ,通常 可 以 找到 
不 发 生 冲 突 的 哈 希 函数 ,从 而 避免 出 现 冲突 ,使 查找 时 间 复 杂 度 为 0(1) ,提高 了 查找 效率 ， 
因此 对 频繁 进行 查找 的 关键 字 集 应 尽力 设计 一 个 完美 的 哈 希 函数 。 


942 哈 希 函数 的 构造 方法 
构造 哈 希 丽 数 的 目标 是 使 所 有 元 素 的 哈 希 地 址 尽 可 能 均匀 地 分 布 在 六 个 连续 内 存 音 


元 上 ,同时 使 计算 过 程 尽 可 能 简单 以 达到 尽 可 能 高 的 时 间 效 率 。 根 据 关键 字 的 结构 和 分 布 
的 不 同 可 构造 出 许多 不 同 的 哈 希 函数 。 这 里 主要 讨论 几 种 常用 的 整数 类 型 关键 字 的 哈 希 函 
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数 构造 方法 。 


直接 定 址 法 是 以 关键 字 & 本 身 或 关键 字 加 上 某 个 常量 c 作为 哈 希 地 址 的 方法 。 直 接 定 
址 法 的 喻 希 函 数 h(k) 为 : 扫 - 扫 
h(k) =k+e 
例如 ,图 9. 30 所 示 的 哈 希 表 就 是 采用 了 这 种 方法 。 
这 种 方法 的 特点 是 哈 希 函数 计算 简单 。 当 关键 字 的 分 布 基本 连续 时 ， 
可 用 直接 定 址 法 的 哈 希 函数 ; 否则 ,车 关键 字 的 分 布 不 连续 将 造成 内 存单 视频 讲解 
元 的 大 量 浪费 。 


除 留 余数 法 是 用 关键 字 & 除 以 某 个 不 大 于 哈 希 表 长 度 mm 的 整数 p 所 得 的 余数 作为 哈 
希 地 址 。 除 留 余数 法 的 喻 希 函 数 h(k) 通 常 为 : 

h(k) 二 kmod p (mod 为 求 余 运 算 ,p 三 m) 

除 留 余数 法 的 计算 比较 简单 ,适用 范围 广 , 是 最 经 常 使 用 的 一 种 哈 希 函数 。 这 种 方法 的 
关键 是 选 好 p ,使 得 元 素 集合 中 的 每 一 个 关键 字 通 过 该 函数 转换 后 映射 到 喻 希 表 范围 内 的 
任意 地 址 上 的 概率 相等 ,从 而 尽 可 能 减少 发 生 冲 突 的 可 能 性 。 例 如 ,p 取 奇 数 就 比 取 偶数 
好 。 理 论 研究 表明 ,p 取 不 大 于 m 的 素数 时 效果 最 好 。 

例如 ,对 于 例 1. 1 的 逻辑 结构 City, 假 设 以 区 号 作为 关键 字 , 哈 希 表 长 度 m 二 7, 选 用 哈 
希 函 数 ,其 中 p==7: 

















h( 区 号 ) 二 VAL( 区 号 ) mod 7 
其 中 ,区 号 为 数字 串 ,VAL( 区 号 ) 用 于 将 区 号 转换 成 对 应 的 数值 ,计算 结果 如 下 : 





区 号 010 021 027 029 025 
VAL( 区 号 ) 10 21 27 29 25 
h(key) 3 0 6 ' 4 


设 喻 希 表 为 ha[0..6], 可 以 得 到 如 图 9. 32 所 示 的 City 的 哈 希 表 。 

















地 址 

0 上 海 ' 直辖 市 

1 Xian 西安 , 陕西 省 省 会 

2 | 

3 010 Beijing 京 ， 首都 

4 025 Nanjing 京 , 江苏 省 省 会 mm 
§ 

6 027 Wuhan 武汉 ,湖北 省 省 会 





9.32 City 对 应 的 哈 希 表 


3 了 数 了 人 六 术 六 


该 方法 是 提取 关键 字 中 取 值 较 均 匀 的 数字 位 作为 哈 希 地 址 。 它 适合 于 所 有 关键 字 值 都 
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已 知 的 情况 ,并 需要 对 关键 字 中 每 一 位 的 取 值 分 布 情况 进 “位 序 















































1.2 34. 5 6 7 8 

行 分 析 。 9|213|1|7|slol: 
例如 有 一 组 关键 字 如 图 9. 33 所 示 。 通 过 分 析 可 知 ,每 9|2|3|2|6ljsg|l7|s 

个 关键 字 从 左 到 右 的 第 1.2、3 位 和 第 6 位 取 值 较 集 中 ,不 91217|131916|218 
宜 作为 哈 希 地 址 ,剩余 的 第 4、5、7 和 8 位 取 值 较 分 散 ,可 根 3 : 4 3 s : : 
据 实际 需要 取 其 中 的 若干 位 作为 哈 希 地 址 。 若 取 最 后 两 位 5 3 ee 
作为 哈 硕 地 址 , 则 哈 希 地 址 集合 为 (2.75,28,34,16.38,62， Gp ll lel 
20)。 这 样 设计 的 喻 希 函 数 将 一 个 大 的 数据 取 值 范围 映射 9|2|3|9|4|2|2|0 








到 一 个 小 的 数据 取 值 范围 。 

其 他 构造 整数 关键 字 的 哈 希 函数 的 方法 还 有 平方 取 中 
法 、 折 秋 法 等 。 平方 取 中 法 是 取 关键 字 平方 后 分 布 均匀 的 几 位 作为 哈 希 地 址 的 方法 ; 折 琶 
法 是 先 把 关键 字 中 的 若干 段 作 为 一 小 组 ,然后 把 各 小 组 折 又 相 加 后 分 布 均匀 的 几 位 作为 哈 
希 地 址 的 方法 。 扫 - 扫 


943 哈 希 冲突 的 解决 方法 
解决 哈 希 冲突 方法 有 许多 ,主要 有 开放 定 址 法 和 拉链 法 两 大 类 。 


开放 定 址 法 (open addressing) 就 是 在 出 现 哈 希 冲突 时 在 哈 硕 表 中 找 一 个 新 的 空闲 位 置 
存放 元 素 。 例 如 要 存放 关键 字 为 k; 的 元 素 ,4d=A(A) ,而 地 址 为 d 的 单元 已 经 被 其 他 元 素 
占用 了 ,那么 就 在 d 地 址 的 前 后 找 空闲 位 置 。 就 像 某 个 人 买 了 一 张 电影 票 , 他 晚 到 了 电影 
院 , 他 的 位 置 被 其 他 人 占 了 ,他 就 在 周围 找 一 个 空 座位 坐 下 来 。 那 么 怎么 找 空闲 单元 呢 ? 根 
据 开 放 定 址 法 找 空 闲 单元 的 方式 又 分 为 线性 探测 法 和 平方 探测 法 等 。 

1) 线性 探测 法 

线性 探测 法 (linear probing) 是 从 发 生 冲 突 的 地 址 ( 设 为 do) 开 始 , 依 次 探测 do 的 下 一 个 地 
址 ( 当 到 达 下 标 为 m 一 1 的 哈 希 表 表 尾 时 ,下 一 个 探测 地 址 是 表 首 地 址 0) ,直到 找到 一 个 空闲 
单元 为 止 ( 当 m 宇 n 时 一 定 能 够 找到 一 个 空闲 单元 )。 线 性 探测 法 的 数学 递 推 描述 公式 为 

do = h(k) 

di= (dt+l)modm (<i<m—1) 
其 中 , 模 m 是 为 了 保证 找到 的 位 置 在 0~m 一 1 的 有 效 空间 中 。 以 前 面 的 看 电影 为 例 , 假 设 
电影 院 座位 只 有 一 排 ( 共 20 个 座位 ) ,他 的 座位 是 8( 被 其 他 人 占 了 ) ,线性 探测 法 就 是 依次 
查看 9,10,… ,20 的 座位 是 否 为 空 的 ,有 空 就 坐 下 ,否则 再 查看 1,2,…,7 的 座位 是 否 为 空 
的 ,如 此 这 样 ,他 总 可 以 找到 一 个 空 座 位 坐 下 。 

线性 探测 法 的 优点 是 解决 冲突 简单 ,一 个 重大 的 缺点 是 容易 产生 堆积 问题 。 这 是 由 于 
当 连 续 出 现 若干 个 同义词 时 ( 设 第 一 个 同义词 占用 单元 du ,这 连续 的 若干 个 同义词 将 占用 
喻 希 表 的 do .do 十 1、do 十 2 等 单元 ) ,随后 任何 do 十 1、do 十 2 等 单元 上 的 哈 希 映射 都 会 由 于 前 
面 的 同义词 堆积 而 产生 冲突 ,尽管 随后 的 这 些 关键 字 并 没有 同义词 。 这 称 为 非 同义词 冲突 ,就 
是 哈 希 函数 值 不 相同 的 两 个 元 素 争夺 同一 个 后 继 哈 希 地 址 导致 出 现 堆积 (或 聚集 现象。 

【 例 9.9】 假设 喻 希 表 的 长 度 二 13, 采 用 除 留 余数 法 加 线性 探测 法 建立 关键 字 集 合 


9.33 一 组 关键 字 
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(16,74,60,43,54,90,46,31,29,88,77) 的 哈 希 表 。 
这 里 二 11,m 二 13, 采 用 除 留 余 数 法 设计 的 哈 希 函数 为 h(k) 二 k mod p,p 应 为 小 
于 等 于 m 的 素数 ,假设 p 取 值 13, 并 采用 线性 探测 法 解决 冲突 。 则 有 : 


h(16)=3, 

h(74)=9, 

h(60)=8, 

h(43)=4, 

h(54)=2, 

h(90)=12, 

h(46)=7, 

h(31)=5, 

h(29)=3 
do=3,d1=(3+1) mod 13 一 4 
由 一 (4 十 1) mod 13=5 
ds=(5+1) mod 13=6 

h(88)=10, 

h(77)=12, 
do=12,di=(12+1) mod 13=0 


建立 的 哈 希 表 ha[0..12] 如 表 9. 1 所 示 。 
表 9.1 哈 希 表 ha[0..12] 


没有 冲突 ,将 16 放 在 ha[3] 处 ,探测 1 次 
没有 冲突 ,将 74 放 在 ha[9] 处 ,探测 1 次 
没有 冲突 ,将 60 放 在 ha[8] 处 ,探测 1 次 
没有 冲突 ,将 43 放 在 ha[4] 处 ,探测 1 次 
没有 冲突 ,将 54 放 在 ha[2] 处 ,探测 1 次 
没有 冲突 ,将 90 放 在 ha[12] 处 ,探测 1 次 
没有 冲突 ,将 46 放 在 ha[7] 处 ,探测 1 次 
没有 冲突 ,将 31 放 在 ha[5] 处 ,探测 1 次 
有 冲突 

仍 有 冲突 

仍 有 冲突 

冲突 已 解决 ,将 29 放 在 ha[6] 处 ,探测 4 次 
没有 冲突 ,将 88 放 在 ha[10] 处 ,探测 1 次 
有 冲突 

冲突 已 解决 ,将 77 放 在 ha[0] 处 ,探测 两 次 











下 标 0 1 2 3 4 5 6 § 8 9 10 11 12 

关键 字 77 54 16 43 31 29 46 60 74 88 90 

探测 次 数 ] 1 1 1 1 4 1 1 zi 1 1 
2) 平方 探测 法 


设 发 生 冲 突 的 地 址 为 do ,平方 探测 法 (square probing) 的 探测 序列 为 do 十 1? ,do 一 1?， 
co 十 2 ,do 一 2 ,…。 平 方 探测 法 的 数学 描述 公式 为 : 


do = h(k) 


di = (do ti) modm 
仍 以 前 面 的 看 电影 为 例 ,平方 探测 法 就 是 在 他 被 占用 的 座位 前 后 来 回 找 空 座位 。 
平方 探测 法 是 一 种 较 好 地 处 理 冲 突 的 方法 ,可 以 避免 出 现 堆积 问题 。 其 缺点 是 不 一 定 
能 探测 到 喻 希 表 上 的 所 有 单元 ,但 最 少 能 探测 到 一 半 单 元 。 
此 外 ,开放 定 址 法 的 探测 方法 还 有 伪 随 机 序列 法 、 双 哈 希 函数 法 等 。 
从 中 可 以 看 出 ,开放 定 址 法 中 哈 希 表 空 闲 单元 既 向 同义词 关键 字 开放 ,也 向 发 生 冲 突 的 
非 同义词 关键 字 开 放 , 这 就 是 它 的 名 称 的 由 来 。 至 于 哈 希 表 的 一 个 地 址 中 存放 的 是 同义词 


(1<i<m—1) 





关键 字 还 是 非 同义词 关键 字 , 要 看 谁 先 占用 它 , 这 和 构造 哈 希 表 的 元 素 排列 次 序 有 关 。 


回 | 

拉链 法 (chaining) 是 把 所 有 的 同义词 用 单 链 表 链 接 起 来 的 方法 。 如 图 

9.34 所 示 ,所 有 哈 希 地 址 为 i 元素 对 应 的 结 点 构成 一 个 单 链表 , 哈 希 表 地 址 
空间 为 0~~m 一 1, 地 址 为 i 的 单元 是 一 个 指向 对 应 单 链表 的 首 结 点 。 


的 = 才 
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在 这 种 方法 中 , 哈 希 表 的 每 个 单元 中 存放 的 不 再 是 元 素 本 身 ,而 是 相应 同义词 单 链表 的 
首 结 点 指针 。 由 于 在 单 链表 中 可 插入 任意 多 个 结 点 ,所 以 此 时 装填 因子 a 根据 同义词 的 多 
少 既 可 以 设 定 为 大 于 1, 也 可 以 设 定 为 小 于 或 等 于 1, 通常 取 a 二 1。 
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m-l 
图 9.34 拉链 法 的 示意 图 


与 开放 定 址 法 相 比 ,拉链 法 有 以 下 几 个 优点 : 

(1) 拉链 法 处 理 冲 突 简单 , 且 无 堆积 现象 , 即 非 同义词 绝 不 会 发 生 冲 突 , 因 此 平均 查找 
长 度 较 短 ; 

(2) 由 于 拉链 法 中 各 单 链 表 上 的 结 点 空间 是 动态 申请 的 , 故 它 更 适合 于 造 表 前 无 法 确 
定 表 长 的 情况 ; 

(3) 开放 定 址 法 为 减少 冲突 要 求 装填 因子 a 较 小 , 故 当 数据 规模 较 大 时 会 浪费 很 多 空 
间 ,而 拉链 法 中 可 取 a 宇 1, 且 元 素 较 大 时 拉链 法 中 增加 的 指针 域 可 忽略 不 计 , 因 此 节省 
空间 ; 

(4) 在 用 拉链 法 构造 的 哈 希 表 中 ,删除 结 点 的 操作 更 加 易于 实现 。 

拉链 法 也 有 缺点 : 指针 需要 额外 的 空间 , 故 当 元 素 规模 较 小 时 开放 定 址 法 较为 节省 空 
间 , 若 将 节省 的 指针 空间 用 来 扩大 哈 希 表 的 规模 ,可 使 装填 因子 变 小 ,这 又 减少 了 开放 定 址 
法 中 的 冲突 ,从 而 提高 了 平均 查找 速度 。 

【 例 9.10】 假设 哈 希 表 的 长 度 m= 二 13, 采 用 除 留 余数 法 加 拉链 法 建立 关键 字 集 合 (16， 
74,60,43,54,90,46,31,29,88,77) 的 哈 希 表 。 

这 里 n 二 11,m 二 13, 采 用 除 留 余数 法 设计 的 喻 希 函 数 为 h(k) 二 k mod 13, 当 出 现 同 
义 词 问题 时 采用 拉链 法 解决 冲突 。 则 有 : 

h(54) = 2,h(16) = 3,h(29) = 3,h(43) = 4,h(31) 一 5 
h(46) = 7,h(60) = 8,h(74) = 9,h(88) = 10,h(90) = 12,h(77) = 12 

建立 的 哈 希 表 如 图 9. 35 所 示 , 其 中 哈 希 表 地 址 空间 为 0 一 12 ,每 个 地 址 单元 指向 一 个 

单 链表 ,如 果 没有 对 应 的 单 链表 结 点 ,该 地 址 单元 为 空 指针 。 


944 哈 希 表 的 运算 算法 
哈 希 表 的 常见 运算 有 插入 及 建 表 、 删 除 和 查找 等 。 一 个 哈 希 表 由 哈 硕 函数 和 解决 冲突 


方法 构成 ,而 不 同 的 解决 冲突 方法 其 运算 算法 实现 有 较 大 的 差异 ,下 面 分 别 讨论 。 为 了 简 
便 , 算 法 中 假设 每 个 元 素 仅 含有 关键 字 。 
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图 9.35 采用 拉链 法 解决 冲突 建立 的 哈 希 表 


和 用 开放 也 证 关 档 造 的 队 布 表 的 运 竺 等 关 





本 节 仅 介绍 在 开放 定 址 法 中 采用 线性 探测 法 解决 冲突 时 实现 哈 希 表 运 算 算 法 。 设 计 哈 


希 表 的 类 型 如 下 : 


#define NULLKEY 一 1 
# define DELKEY 一 2 
typedef int KeyType; 
typedef struct 
{ KeyType key; 

int count; 
} HashTable; 


关键 字 类 型 为 整数 ,将 哈 希 表 中 空闲 单元 的 关键 字 设 置 为 特殊 值 一 1 ,被 删 元素 的 关键 


字 设 置 为 特殊 值 一 2, 以 示 区 别 。 
1) 插入 及 建 表 算 法 


在 建 表 时 首先 要 将 表 中 各 元 素 的 关键 字 清 空 ,使 其 地 址 为 开放 的 ; 然后 调用 插入 算法 
将 给 定 的 关键 字 序 列 依次 插入 表 中 。 在 插入 算法 中 , 求 出 关键 字 A 的 哈 希 函数 值 adr, 若 该 
位 置 可 以 直接 放置 ( 即 adr 位 置 的 关键 字 为 NULLKEY 或 DELKEY) ,将 其 放 和 人 #; 否则 出 现 
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29| 十 =[16T 人 |] 
43| 信 
31[ 信 
人 
46 | 人 
60 | 人 
74[ 信 
88| 信 
人 
[7 于 -LTA] 





// 定 义 空 关键 字 值 
// 定 义 被 删 关 键 字 值 
// 关 键 字 类 型 


// 关 键 字 域 
// 探 测 次 数 域 
// 哈 希 表单 元 类 型 





冲突 ,采用 线性 探测 法 在 表 中 找到 一 个 开放 地 址 ,将 插入。 对 应 的 算法 如 下 : 


void InsertHT(HashTable ha[] ,int &n,int m,int p,KeyType k) // 将 关键 字 上 插入 到 哈 希 表 中 


{ int iadr; 
adr 一 k % p; 


// 计 算 哈 希 函数 值 


if (ha[adr] .key==NULLKEY | ha[adr] .key==DELKEY) 


{ haladr].key=k; 


/人 KE 可 以 直接 放 在 哈 希 表 中 
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ha[adr] .count= 1; 
} 


else // 发 生 冲 突 时 采用 线性 探测 法 解决 冲突 
{ 这 1; Wi 记录 发 生 冲突 的 次 数 

do 

{ adr=(adr+1) % mi // 线 性 探测 

i 十 3 

} while (ha[adr] .key!=NULLKEY®&ha[adr] .key!=DELKEY); 

ha[adr] .key=k; // 在 adr 处 放置 k 

ha[adr] .count=i; // 设 置 探测 次 数 
} 
n 十 十 ; // 哈 希 表 中 总 元 素 个 数 增 1 


} 
void CreateHT(HashTable ha[] ,int &n,int m,int p, KeyType keys[] ,int n1) 
// 由 关键 字 序列 keys[0. .nl 一 本 创建 哈 希 表 
{ for (inti=0;i<m;it+) // 哈 希 表 置 空 的 初 什 
{ ha[li] .key= NULLKEY:; 
ha[i .count=0; 


! 


n=0; // 哈 希 表 中 总 元 素 个 数 从 0 开始 递增 
for (i=0;i<nl;it+) 
InsertHT(ha, n,m, p, keys[]); // 插 入 nm 个 关键 字 
} 
2) 删除 算法 


在 采用 开放 地 址 法 处 理 冲 突 的 哈 硕 表 上 执行 删除 操作 时 不 能 简单 地 将 被 删 元 素 的 空间 
置 为 空 ,否则 将 截断 在 它 之 后 填 人 哈 硕 表 的 同义词 元 素 的 查找 路 径 ,这 是 因为 在 各 种 开放 地 
址 法 中 ,空地 址 单元 都 是 查找 失败 的 条 件 。 因 此 只 能 在 被 删 元 素 上 做 删除 标记 DELKEY， 
而 不 能 真正 地 删除 元 素 。 对 应 的 算法 如 下 : 


bool DeleteHT(HashTable ha[] ,int &n,int m,int p,KeyType k) // 删 除 哈 希 表 中 的 关键 字 上 





{ int adr; 
adr=k % p; // 计 算 哈 希 函 数值 
while (ha[adr] .key!=NULLKEY && ha[adr] .key! 一 k) 
adr 一 (adr 十 1) % mi // 线 性 探测 
if (ha[adr] . key 王 一 k) // 查 找 成 功 
{ ha[adr].key=DELKEY:; // 删 除 关键 字 k 
return true; 
} 
else // 查 找 失 败 
return false; // 返 回 假 
} 
3) 查找 算法 


哈 希 表 的 查找 过 程 和 建 表 过 程 相似 。 假 设 查 找 关 键 字 ,根据 建 表 时 采用 的 喻 希 函数 及 
计算 出 哈 希 地 址 h(k) , 若 表 中 该 地 址 单元 不 为 空 ( 即 关键 字 值 不 为 NULKEY) 且 该 地 址 的 
关键 字 不 等 于 &, 则 按 建 表 时 采用 的 处 理 冲 突 的 方法 找 下 一 个 地 址 (这 里 采用 线性 探测 法 )， 
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如 此 反复 下 去 ,直到 某 个 地 址 单元 为 空 (查找 失败 ) 或 者 关键 字 比 较 相 等 (查找 成 功 ) 为 止 , 显 
示 相 应 的 结果 。 对 应 的 算法 如 下 : 


void SearchHT(HashTable ha[] ,int m,int p, KeyType k) // 在 哈 希 表 中 查找 关键 字 


{ int i 一 1,adr; 


adr 一 k % p; // 计 算 哈 希 函数 值 

while (ha[adr] .key!=NULLKEY && ha[adr] .key!=k) 

ee // 累 计 关键 字 的 比较 次 数 
adr 一 (adr 十 1) % ml; // 线 性 探测 

} 

if (ha[adr] .key==k) // 查 找 成 功 
printf(" 成 功 : 关键 字 %d, 比 较 %d 次 \n",k,iD; 

else // 查 找 失败 


printf(" 失 败 : 关键 字 %d, 比 较 %d 次 \n",k,iD; 
} 


4) 查找 性 能 分 析 

插入 和 删除 的 时 间 均 取决 于 查找 , 故 这 里 只 分 析 查 找 运算 的 时 间 性 能 。 

查找 成 功 的 平均 查找 长 度 是 指 查找 到 哈 希 表 中 已 有 关键 字 的 平均 探测 次 数 ,实际 上 , 查 
找到 一 个 关键 字 所 需要 的 比较 次 数 恰 好 等 于 对 应 的 探测 次 数 。 对 于 例 9. 9, 在 查找 等 概率 
的 情况 下 ,其 查找 成 功 的 平均 查找 长 度 如 下 : 

ASLan 二 汪汪 生生 

式 中 1X9、2X1 和 4X1 分 别 表示 探测 1.2 和 4 次 的 关键 字 各 有 9、1 和 1 个 。 

而 查找 不 成 功 的 平均 查找 长 度 是 指 在 哈 希 表 中 查找 不 到 待 查 的 元 素 , 最 后 找到 空位 置 
的 探测 次 数 的 平均 值 。 

对 于 例 9. 9 的 哈 希 表 , 采 用 的 是 线性 探测 法 ,假设 待 查 关键 字 不 在 该 表 中 ,如 果 计算 
出 有 (4) 二 0, 则 必须 将 ha[o0] 中 的 关键 字 和 A 进行 ,不 相等 ,再 与 ha[1] 进行 比较 ,发 现 
ha[1] 为 空 ,表示 查找 不 成 功 ,一 共 比 较 两 次 ; 如 果 h(k) 三 1, 将 ha[l] 中 的 关键 字 和 进行 
比较 ,发 现 haLl] 为 空 ,表示 查找 不 成 功 ,一共 比 较 一 次 ; 如 果 h(k) 二 2, 将 ha[2..10] 中 的 关 
键 字 依次 和 A 进行 比较 ,都 不 相等 ,再 与 ha[11] 进行 比较 ,发 现 ha[11] 为 空 ,表示 查找 不 成 
功 ,一 共 比 较 10 次 ; 如 果 h(k) 二 3, 将 haL3..10] 中 的 关键 字 依次 和 & 进行 比较 ,都 不 相等 ， 
再 与 ha[11] 进 行 比较 ,发 现 haL11] 为 空 ,表示 查找 不 成 功 ,一 共 比 较 9 次 。 依 此 类 推 ,得 出 
查找 不 成 功 的 平均 查找 长 度 为 : 
2 十 1 十 10 十 9 十 8 十 7 十 6 十 5 十 4 十 3 十 2 十 1 十 3 





1. 364 











ASIL 不 成功 
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由 此 得 出 采用 线性 探测 法 时 计算 成 功 和 不 成 功 平均 查找 长 度 的 算法 如 下 : 


void ASL(HashTable ha[] ,int n, int m,int p) // 求 平均 查找 长 度 
{ inti,j; 
int succ 一 0,unsucc 一 0,s; 
for (i 一 0;i< mi;i 十 十 ) 
if (ha[i] .key!=NULLKEY) 
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succ+=ha[i] .count; // 累 计 成 功 时 的 总 关键 字 比 较 次 数 
printf(" 成 功 情况 下 ASL(%d)==%g\n",n,succ*1.0/n); 
for (i=0;i<p;i+ 十 ) 
el 
while (haD] .key!=NULLKEY) 
人 
j=G+1) % m; 
} 
unsucc 十 一 s; // 累 计 不 成 功 时 的 总 关键 字 比 较 次 数 


} 
printf(" 不 成 功 情况 下 ASL(%d)==%g\n",n,unsucc* 1.0/p); 
} 


【 例 9. 11〗 用 关键 字 序列 {7,8,30,11,18,9,14} 构 造 一 个 哈 希 表 , 哈 希 表 的 存储 空间 
是 一 个 下 标 从 0 开始 的 一 维 数组 , 哈 希 函数 为 H(key) 二 (keyX3) mod 7, 处 理 冲突 采用 线 
性 探测 法 ,要 求 装填 ( 载 ) 因 子 为 0.7。 

(1) 夯 出 所 构造 的 哈 希 表 。 

(2) 分 别 计 算 等 概率 情况 下 查找 成 功 和 查找 不 成 功 的 平均 查找 长 度 。 

(1) 这 里 n=7,a=0.7==n/m, 则 m=n/0.7 二 10。 

计算 各 关键 字 存储 地 址 的 过 程 如 下 : 








H(7)=7X3 mod 7=0 
H(8)=8X3 mod 7=3 
H(30)=30X3 mod 7=6 





























H(11)=11X3 mod 7=5 
H(18)=18X3 mod 7=5 冲突 时 
di 二 (5 十 1) mod 10==6 仍 冲 突 3 
中 一 (6 十 1) mod 10=7 
H(9)=9X3 mod 7 一 6 冲突 > 
di 二 (6 十 1) mod 10=7 。 仍 冲突 i 
中 一 (7 十 1) mod 10=8 
H(14)=14X3 mod 7=0 冲突 
di=(0+1) mod 10=1 
构造 的 哈 希 表 如 表 9. 2 所 示 。 
表 9.2 哈 希 表 
下 标 0 1 多 1 4 5 6 7 8 9 
关键 字 14 8 11 30 18 9 
探测 次 数 1 2 1 1 1 3 . 








(2) 在 等 概率 情况 下 : 
ASLas 有 1.71 


由 于 任 一 关键 字 A, 瓦 (A) 的 值 只 能 是 0 一 6, 在 不 成 功 的 情况 下 , 瓦 (4) 为 0 时 需要 比较 
3 次 , 互 (A) 为 1 时 需要 比较 两 次 , 瑟 (&) 为 2 时 需要 比较 一 次 ,有 H(k) 为 3 时 需要 比较 两 次 ， 








五 (&) 为 4 时 需要 比较 一 次 , 瑟 (A) 为 5 时 需要 比较 5 次 ,有 H(k) 为 6 时 需要 比较 4 次 , 共 7 种 


情况 ,如 表 9. 3 所 示 。 


表 9.3 不 成 功 查找 的 探测 次 数 


AS 查找 | 


























下 标 0 1 3 4 5 6 7 8 9 
关键 字 7 14 8 11 30 18 9 
探测 次 数 3 2 1 | 5 4 3 2 1 
所 以 有 : 
ASL 不 成 功 一 2 二 


2” 用 拉链 决 构造 的 险 希 表 的 运算 


用 拉链 法 构建 的 哈 希 表 是 一 种 顺序 和 链 式 相 结合 的 存储 结构 , 哈 希 表 地 址 空间 为 0 一 


m 一 1。 设 计 哈 希 表 的 类 型 如 下 : 


typedef int KeyType; 
typedef struct node 
{ KeyType key; 
struct node * next; 
) NodeType; 
typedef struct 
{ 
NodeType * firstp; 
} HashTable; 


1) 插入 及 建 表 算 法 


建 表 过 程 是 首先 将 ha[ 门 (0 志 i 过 m 一 1) 的 firstp 指针 设置 为 空 ,然后 调用 插入 算法 插 和 人 


7 个 关键 字 。 算 法 如 下 : 


void InsertHT(HashTable ha[] ,int &n,int p, KeyType k) // 将 关键 字 k 插入 到 哈 希 表 中 


{ int adr; 
adr=k % p; 
NodeType * q; 


q= (NodeType * )malloc(sizeof(NodeType)); 


q 一 > key=k; 

q 一 > next 王 NULL; 

if (ha[adr] .firstp== NULL) 
ha[adr] .firstp= q; 


else 


{ q—>next=ha[adr].firstp; 


ha[adr] .firstp= q; 
} 
ny 
} 


// 关 键 字 类 型 
// 关 键 字 域 


// 下 一 个 结 点 指针 
// 单 链表 结 点 类 型 


// 首 结 点 指针 
// 哈 希 表单 元 类 型 


// 计 算 哈 希 函数 值 


// 创 建 一 个 结 点 q, 存 放 关 键 字 上 


// 若 单 链表 adr 为 空 





// 若 单 链表 adr 不 空 
// 采 用 头 插 法 插入 到 haLadr] 的 单 链表 中 


// 哈 希 表 中 结 点 的 总 个 数 增 1 


void CreateHT(HashTable ha[] ,int &n,int m,int p, KeyType keys[] ,int nl) 
// 由 关键 字 序 列 keys[0. .nl 一 巧 创建 哈 希 表 
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{ for (inti=0;i<m;it+) // 哈 希 表 置 初 什 
ha[i] .firstp= NULL:; 
n=0; 
for (i=0;i<nl;it+) 
InsertHT(ha, n, p, keys[i]); // 插 入 n 个 关键 字 
} 
2) 删除 算法 


如 果 要 在 哈 希 表 中 删除 关键 字 为 k 的 结 点 ,首先 在 单 链表 haLh(8)] 中 找到 对 应 的 结 点 
gq, 通过 前 驱 结 点 preq 来 删除 它 。 不 同 于 用 开放 地 址 法 构建 的 哈 希 表 , 在 这 里 可 以 直接 删 





除 。 算 法 如 下 : 
bool DeleteHT(HashTable ha[] ,int &n,int m,int p,KeyType k) // 删 除 哈 希 表 中 的 关键 字 k 
{ intadr; 
adr=k % p; // 计 算 哈 希 函 数值 
NodeType * q, * preq; 
q= ha[adr] .firstp; //q 指向 对 应 单 链表 的 首 结 点 
if (q== NULL) 
return false; // 对 应 单 链表 为 空 
if (q—> key==k) // 首 结 点 为 k 
{ ha[adr].firstp=q—> next; // 删 除 结 点 q 
free(q); 
i // 结 点 的 总 个 数 减 1 
return true; // 返 回 真 
} 
preq 一 q; d=q—> next; // 首 结 点 不 为 k 时 
while (q!= NULL) 
{ if(q->key==k) // 查 找 成 功 
break; // 退 出 循环 
gq 一 q 一 > next; 
} 
if (q!=NULL) // 查 找 成 功 
{ preq—> next 一 q 一 > next; // 删 除 结 点 q 
free(q); 
(me // 结 点 的 总 个 数 减 1 
return true; // 返 回 真 
} 
else return false; // 未 找到 k, 返 回 假 
} 
3) 查找 算法 


在 哈 希 表 中 查找 关键 字 为 & 的 结 点 ,只 需要 在 单 链表 ha[h(k)] 中 找到 对 应 的 结 点 g, 并 
累计 关键 字 的 比较 次 数 。 当 4 为 空 时 表示 查找 不 成 功 。 算 法 如 下 : 
void SearchHT(HashTable ha[] ,int p, KeyType k) // 在 哈 希 表 中 查找 关键 字 k 


{ inti=0,adr; 


adr 一 k % p; // 计 算 哈 希 函数 值 
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NodeType * q; 
q=ha[adr] .firstp; //q 指 向 对 应 单 链表 的 首 结 点 
while (q!=NULL) // 扫 描 单 链表 adr 的 所 有 结 点 
二 

if (q—> key==k) // 查 找 成 功 

break; // 退 出 循环 

gq 王 q 一 > next; 
} 
if (q!=NULL) // 查 找 成 功 

printf(" 成 功 : 关键 字 %d, 比较 %d 次 \n",k,D); 
else // 查 找 失 败 


printf(" 失 败 : 关键 字 %d, 比较 %d 次 \n", kk,D); 


4) 查找 性 能 分 析 
以 例 9. 10 进行 讨论 。 对 于 哈 希 表 中 存在 的 某 个 关键 字 A, 对 应 的 结 点 在 单 链 表 h[k] 
中 , 它 属 于 该 单 链表 的 第 几 个 结 点 ,成 功 找到 它 恰 好 需要 几 次 关键 字 比较 ,所 以 有 : 


ps 全 三 一 = 1.182 


式 中 ,1X9 表示 有 9 个 结 点 成 功 找到 各 需要 一 次 比较 ,2X2 表示 有 两 个 结 点 成 功 找到 各 需 
要 两 次 比较 。 

若 待 查 关键 字 k 的 喻 希 地 址 为 d 二 h(k) (0 过 d 声 m 一 1), 且 第 d 个 单 链表 中 有 i 个 结 点 ， 
则 当 A 不 在 该 单 链表 中 出 现时 需 做 ; 次 关键 字 的 比较 (不 包括 空 指针 判定 ) 才 能 确定 查找 失 
败 , 因 此 有 : 


Pe 人 0. 846 


由 此 得 出 采用 拉链 法 时 计算 成 功 和 不 成 功 的 平均 查找 长 度 的 算法 如 下 : 








void ASL(HashTable ha[] ,int n,int m)  // 求 平均 查找 长 度 
{ intsucc=0,unsucc=0,s; 





NodeType * q; 
for (int i=0;i< mi;i 十 十 ) // 扫 描 5 所 有 哈 希 表 地 址 空间 
,0 
q=ha[i] .firstp; //q 指 向 单 链表 i 的 首 结 点 
while (q!= NULL) // 扫 描 单 链表 i 的 所 有 结 点 
{ gq=q—>next; 
s 十 十 ; //s 记录 当前 结 点 是 对 应 单 链表 的 第 几 个 结 点 ~ 
succ 十 一 si // 累 计 成 功 的 总 比较 次 数 
} 
unsucc 十 一 si // 累 计 不 成 功 的 总 比较 次 数 


} 
printf(" 成 功 情况 下 ASL(%d)==%g\n",n,succ* 1.0/n); 
printf(" 不 成 功 情况 下 ASL(%d)==%g\n",n,unsucc* 1.0/m); 
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从 上 述 讨 论 可 以 看 出 ,由 同一 个 哈 希 函数 .不同 的 解决 冲突 方法 构造 的 哈 希 表 , 其 平均 
查找 长 度 可 能 不 同 。 

在 一 般 情况 下 ,假设 哈 希 函数 是 均匀 的 , 则 可 以 证 明 不 同 的 解决 冲突 方法 得 到 的 哈 希 表 
的 平均 查找 长 度 不 同 。 表 9. 4 列 出 了 用 几 种 不 同 的 方法 解决 冲突 时 哈 希 表 的 平均 查找 长 
度 。 从 中 可 以 看 到 , 喻 希 表 的 平均 查找 长 度 不 是 元 素 个 数 的 函数 ,而 是 装填 因子 a 的 函 
数 。 因 此 ,在 设计 喻 希 表 时 可 选择 合适 的 a 以 控制 喻 希 表 的 平均 查找 长 度 。 

表 9.4 用 几 种 不 同 的 方法 解决 冲突 时 输 希 表 的 平均 查找 长 度 





























平均 查找 长 度 

解决 冲突 的 方法 

成 功 的 查找 不 成 功 的 查找 
线性 探测 法 至 + 二 于 1+ 
平方 探测 法 一 二 log.(1 一 o) 二 
拉链 法 1+ 名 ate ~a 

Ss 本章 小 结 = 
本 章 的 基本 学 习 要 点 如 下 : 


(1) 理解 查找 的 基本 概念 ,包括 静态 查找 表 和 动态 查找 表 、 内 查找 和 外 
查找 之 间 的 差异 以 及 平均 查找 长 度 等 。 

(2) 掌握 线性 表 上 的 各 种 查找 算法 ,包括 顺序 查找 、 折 半 查 找 和 分 块 查 
找 的 基本 思路 ,算法 实现 和 查找 效率 分 析 等 。 

(3) 掌握 各 种 树 表 的 查找 算法 ,包括 二 叉 排 序 树 .AVL 树 、.B- 树 和 B+ 树 的 基本 思路 、 
算法 实现 和 查找 效率 等 。 

(4) 掌握 哈 希 表 查 找 技术 以 及 哈 希 表 与 其 他 存储 方法 的 区 别 。 

(5) 灵活 地 运用 各 种 查找 算法 解决 一 些 综合 应 用 问题 。 




















1. 设 有 5 个 数据 do、for,if、repeat、while, 它 们 排 在 一 个 有 序 表 中 ,其 查找 概率 分 别 是 
pi 二 0.2,ps 二 0.15,ps 二 0.1,p4 二 0.03,ps 二 0.01, 而 查找 它们 之 间 不 存在 数据 的 概率 分 别 
为 go 二 0.2,q1 二 0.15,gs 二 0.1,gs 二 0.03,qs 二 0.02,gs 二 0.01, 该 有 序 表 如 下 : 

















do for if repeat while 
go nn a Pp g3 Pa gq4 Ps gs 
(1) 试 画 出 对 该 有 序 表 分 别 采用 顺序 查找 和 折 半 查找 时 的 判定 树 。 
(2) 分 别 计算 顺序 查找 的 查找 成 功 和 不 成 功 的 平均 查找 长 度 。 
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(3) 分 别 计算 折 半 查找 的 查找 成 功 和 不 成 功 的 平均 查找 长 度 。 

2. 对 于 A[0..10] 有 序 表 , 在 等 概率 的 情况 下 求 采 用 折 半 查找 法 时 , 求 成 功 和 不 成 功 时 
的 平均 查找 长 度 。 对 于 有 序 表 (12,18,24,35,47,50,62,83,90,115,134), 当 用 折 半 查找 法 
查找 90 时 需要 进行 多 少 次 查找 可 确定 成 功 ? 查找 47 时 需要 进行 多 少 次 查找 可 确定 成 功 ? 
查找 100 时 需要 进行 多 少 次 查找 才能 确定 不 成 功 ? 

3. 有 以 下 查找 算法 : 


int fun(int a[] ,int n, int k) 
{ inti; 
for (i=0;i<n;i+=2) 
if (a ==k) 
return i; 
for (i=1;i<n;i+=2) 
if (a ==k) 
return i; 
return —1; 


} 


(1) 指出 fun(a,n,k) 算 法 的 功能 。 

(2) 当 a[]=={2,6,3,8,1,7,4,9} 时 ,执行 fun(a,n,1) 后 的 返回 结果 是 什么 ? 一共 进 行 
了 几 次 比较 ? 

(3) 当 a[]={2,6,3,8,1,7,4,9)} 时 ,执行 fun(a,n,5) 后 的 返回 结果 是 什么 ? 一 共 进 行 
了 几 次 比较 ? 

4. 假设 一 棵 二 叉 排序 树 的 关键 字 为 单个 字母 ,其 后 序 遍 历 序列 为 ACDBFIJHGE, 回 
答 以 下 问题 ， 

(1) 夯 出 该 二 又 排序 树 。 

(2) 求 在 等 概率 下 的 查找 成 功 的 平均 查找 长 度 。 

(3) 求 在 等 概率 下 的 查找 不 成 功 的 平均 查找 长 度 。 

5. 证 明 如 果 一 棵 非 空 二 又 树 ( 所 有 结 点 值 均 不 相同 ) 的 中 序 遍历 序列 是 从 小 到 大 有 序 
的 , 则 该 二 又 树 是 一 棵 二 又 排 序 树 。 

6. 由 23、12、45 关键 字 构 成 的 二 又 排序 树 有 多 少 棵 ”其 中 属于 平衡 二 又 树 的 有 多 
少 棵 ? 

7. 将 整数 序列 (4,5,7,2,1,3,6) 中 的 元 素 依次 插入 到 一 棵 空 的 二 又 排 序 树 中 , 试 构造 
相应 的 二 又 排序 树 ,要 求 用 图 形 给 出 构造 过 程 。 

8. 将 整数 序列 (4,5,7,2,1,3,6) 中 的 元 素 依次 插入 到 一 棵 空 的 平衡 二 又 树 中 , 试 构造 





相应 的 平衡 二 又 树 ,要求 用 图 形 给 出 构造 过 程 。 aa 


9. 已 知 一 棵 5 阶 B- 树 中 有 53 个 关键 字 , 则 树 的 最 大 高 度 是 多 少 ? 

10. 设 有 一 组 关键 字 (19,1,23,14,55,20,84,27,68,11,10,77), 其 哈 希 函数 为 h(key) 二 
key % 13。 采 用 开放 地 址 法 的 线性 探测 法 解决 冲突 , 试 在 0 一 18 的 哈 希 表 中 对 该 关键 字 序 
列 构 造 哈 希 表 , 并 求 在 成 功 和 不 成 功 情况 下 的 平均 查找 长 度 。 

11. 设计 一 个 折 半 查找 算法 , 求 查找 到 关键 字 为 k 的 记录 所 需 关键 字 的 比较 次 数 。 假 
设 k 与 R[ 门 . key 比较 得 到 3 种 情况 , 即 = 二 二 R[ 疏 . key、k 二 R[i]. key 或 者 & 记 R[i]. key, 计 
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为 一 次 比较 (在 教材 中 讨论 关键 字 比较 次 数 时 都 是 这 样 假设 的 ) 。 

12. 设计 一 个 算法 ,判断 给 定 的 二 叉 树 是 否 为 二 叉 排 序 树 。 假 设 二 又 树 中 结 点 的 关键 
字 均 为 正 整 数 且 均 不 相同 。 

13. 设计 一 个 算法 ,在 一 棵 非 空 二 叉 排序 树 bt 中 求 出 指定 关键 字 为 k 结 点 的 层次 。 

14. 设计 一 个 哈 希 表 ha[L0..m 一 1 存放 n 个 元 素 , 喻 希 函 数 采用 除 留 余数 法 H(key) 二 
key%p(p 三 m) ,解决 冲突 的 方法 采用 开放 定 址 法 中 的 平方 探测 法 。 

(1) 设计 喻 希 表 的 类 型 。 

(2) 设计 在 哈 希 表 中 查找 指定 关键 字 的 算法 。 


一 >- 上 机 实验 题 9 一 


戎 验证 性 实验 

实验 题 1: 实现 顺序 查找 的 算法 

目的 : 领会 顺序 查找 的 过 程 和 算法 设计 。 

内 容 : 编写 一 个 程序 exp9-1. cpp, 输 出 在 顺序 表 (3.6,2,10,1,8,5,7,4,9) 中 采用 顺序 
查找 方法 查找 关键 字 5 的 过 程 。 


实验 题 2: 实现 折 半 查找 的 算法 

目的 : 领会 折 半 查找 的 过 程 和 算法 设计 。 

内 容 : 编写 一 个 程序 exp9-2. cpp, 输 出 在 顺序 表 (1,2,3,4,5,6,7,8,9,10) 中 采用 折 半 
查找 方法 查找 关键 字 9 的 过 程 。 

实验 题 3: 实现 分 块 查找 的 算法 

目的 : 领会 分 块 查找 的 过 程 和 算法 设计 。 

内 容 : 编写 一 个 程序 exp9-3. cpp, 输 出 在 顺序 表 (8,14,.6,9,10,22,34,18,19,31,40， 
38,54,66,46,71,78,68,80,85,100,94,88,96,87) 中 采用 分 块 查 找 法 查找 (每 块 的 块 长 为 
5, 共 有 5 块 ) 关 键 字 46 的 过 程 。 


实验 题 4: 实现 二 叉 排 序 树 的 基本 运算 算法 

目的 : 领会 二 又 排序 树 的 定义 ,二 又 排序 树 的 创建 .查找 和 删除 过 程 及 其 算法 设计 。 

内 容 : 编写 一 个 程序 bst. cpp, 包 含 二 叉 排序 树 的 创建 查找 和 删除 算法 ,在 此 基础 上 编 
写 exp9-4. cpp 程序 完成 以 下 功能 。 

(1) 由 关键 字 序 列 (4,9,0,1,8,6,3,5,2,7) 创 建 一 棵 二 叉 排序 bt 并 以 括号 表示 法 
输出 。 

(2) 判断 bt 是 否 为 一 棵 二 又 排序 。 

(3) 采用 递归 和 非 递归 两 种 方法 查找 关键 字 为 6 的 结 点 ,并 输出 其 查找 路 径 。 

(4) 分 别 删除 bt 中 关键 字 为 4 和 5 的 结 点 ,并 输出 删除 后 的 二 又 排序 。 

实验 题 5: 实现 哈 希 表 的 相关 运算 算法 

目的 : 领会 哈 希 表 的 构造 和 查找 过 程 及 其 相关 算法 设计 。 

内 容 : 编写 一 个 程序 exp9-5. cpp 实现 哈 希 表 的 相关 运算 ,并 完成 以 下 功能 。 
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(1) 建立 关键 字 序列 (16,74,60,43,54,90,46,31,29,88,77) 对 应 的 哈 希 表 A[0..12]， 
哈 希 函数 为 昌 (k) 二 k%p, 并 采用 开放 址 法 中 的 线性 探测 法 解决 神 突 。 

(2) 在 上 述 哈 希 表 中 查找 关键 字 为 29 的 记录 。 

(3) 在 上 述 哈 希 表 中 删除 关键 字 为 77 的 记录 ,再 将 其 插入 。 
戎 设计 性 实验 

实验 题 6: 在 有 序 序列 中 查找 某 关 键 字 的 区 间 

目的 : 掌握 折 半 查找 的 过 程 及 其 算法 设计 。 

内 容 : 编写 一 个 程序 exp9-6. cpp, 在 有 序 序列 中 查找 某 关 键 字 的 区 间 。 例 如 序列 为 (1， 
2,2,3) ,对 于 关键 字 2, 其 位 置 区 间 是 [1,3) 。 


实验 题 7: 求 两 个 等 长 有 序 序列 的 中 位 数 

目的 : 掌握 折 半 查找 的 过 程 及 其 算法 设计 。 

内 容 : 编写 一 个 程序 exp9-7. cpp, 求 两 个 等 长 有 序 序列 的 中 位 数 , 有 关中 位 数 的 定义 参 
见 第 2 章 的 例 2. 17, 这 里 要 求 采 用 折 半 查找 方法 求解 。 


实验 题 8: 由 有 序 序列 创建 一 棵 高 度 最 小 的 二 叉 排 序 树 

目的 : 掌握 二 叉 排序 树 的 构造 过 程 及 其 算法 设计 。 

内 容 : 编写 一 个 程序 exp9-8. cpp, 对 于 给 定 的 一 个 有 序 的 关键 字 序 列 ,创建 一 棵 高 度 最 
小 的 二 叉 排 序 树 。 


实验 题 9: 统计 一 个 字符 串 中 出 现 的 字符 及 其 次 数 

目的 : 掌握 二 叉 排序 树 的 构造 过 程 及 其 算法 设计 。 

内 容 : 编写 一 个 程序 exp9-9. cpp, 读 入 一 个 字符 串 ,统计 该 字符 串 中 出 现 的 字符 及 其 次 
数 , 然 后 输出 结果 。 要 求 用 一 个 二 又 树 来 保存 处 理 结果 ,字符 串 中 每 个 不 同 的 字符 用 树 描 
述 , 每 个 结 点 包含 4 个 域 ,格式 为 : 


字符 

该 字符 的 出 现 次 数 

指向 ASCII 码 小 于 该 字符 的 左 子 树 指针 
指向 ASCII 码 大 于 该 字符 的 左 子 树 指针 


实验 题 10: 求 一 棵 二 叉 排序 树 查找 成 功 和 失败 情况 下 的 平均 查找 长 度 

目的 : 掌握 二 又 排 序 树 的 查找 过 程 及 其 算法 设计 。 

内 容 : 编写 一 个 程序 exp9-10. cpp, 对 于 给 定 的 关键 字 序 列 ,构造 一 棵 二 又 排序 树 bt ,并 
求 bt 在 查找 成 功 和 失败 情况 下 的 平均 查找 长 度 。 

实验 题 11: 判断 一 个 序列 是 否 为 二 叉 排 序 树 中 的 一 个 合法 的 查找 序列 

目的 : 掌握 二 又 排序 树 的 查找 过 程 及 其 算法 设计 。 

内 容 : 编写 一 个 程序 exp9-11. cpp, 利 用 本 章 实验 题 4 的 bst. cpp 程序 构造 一 棵 二 又 排 
序 树 bt ,判断 一 个 序列 a 是 否 为 二 又 排序 树 bt 中 的 一 个 合法 的 查找 序列 。 


实验 题 12: 求 二 又 排 序 树 中 两 个 结 点 的 最 近 公共 祖先 
目的 : 掌握 二 又 排 序 树 的 递归 查找 过 程 及 其 算法 设计 。 
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内 容 : 编写 一 个 程序 exp9-12. cpp, 利 用 本 章 实验 题 4 的 bst. cpp 程序 构造 一 棵 二 又 排 
序 树 bt, 输 出 bt 中 关键 字 分 别 为 z、y 的 结 点 的 最 近 公 共 祖 先 (LCA)。 

戎 综 合 性 实验 

实验 题 13: 改进 折 半 查找 算法 设计 和 分 析 

目的 : 深入 掌握 折 半 查找 过 程 、 折 半 查 找 算法 设计 和 分 析 。 

内 容 : 已 知 一 个 递增 有 序 表 R[1..4n], 并 且 表 中 没有 关键 字 相 同 的 元 素 。 按 以 下 方法 
查找 一 个 关键 字 为 & 的 元 素 : 先 在 编号 为 4,8,12,… ,4n 的 元 素 中 进行 顺序 查找 ,或 者 查找 
成 功 , 或 者 由 此 确定 一 个 继续 进行 顺序 查找 的 范围 。 编 写 程序 exp9-13. cpp, 完 成 以 下 
功能 : 

(1) 设计 满足 上 述 过 程 的 查找 算法 ,并 用 相关 数据 进行 测试 ,分 析 该 算法 在 成 功 情况 下 
的 平均 查找 长 度 。 

(2) 采用 上 述 算法 和 采用 折 半 查找 算法 相 比 哪个 较 好 ? 为 了 提高 效率 ,可 以 对 本 算法 
做 何 改进 ?给 出 改进 后 的 算法 ,并 说 明 改 进 后 的 算法 的 时 间 复 杂 度 。 

实验 题 14: 求 折 半 查找 成 功 时 的 平均 查找 长 度 

目的 : 深入 掌握 折 半 查找 过 程 和 折 半 查找 算法 分 析 。 

内 容 : 编写 一 个 程序 exp9-14. cpp, 建 立 由 有 序 序列 RE0..n 一 1] 进 行 二 分 查找 产生 的 判 
定 树 ,在 此 基础 上 完成 以 下 功能 。 

(1) 输出 n=11 时 的 判定 树 ,并 求 成 功 情况 下 的 平均 查找 长 度 ASL。 

(2) 通过 构造 判定 树 可 以 求 得 的 成 功 情况 下 的 平均 查找 长 度 ASLi; 当 含 有 个 结 点 
的 判定 树 看 成 是 一 棵 满 二 又 树 时 ,其 成 功 情况 下 的 平均 查找 长 度 的 理论 值 ASL; 约 为 
log: (n 十 1) 一 1, 对 于 n= 二 10、100、1000、10 000、100 000 和 1 000 000, 求 出 其 ASLi、ASL。 和 
两 者 的 差 值 。 
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在 第 9 章 介 绍 过 折 半 查找 比 顺 序 查找 的 时 间 性 能 好 得 多 , 但 折 
半 查 找 要 求 被 查找 的 数据 有 序 。 因此, 为 了 提高 数据 的 查找 速度 ， 
需要 对 数据 进行 排序 。 

本 章 介绍 各 种 常用 的 内 排序 方法 , 包括 插入 排序 交换 排序 、 选 
择 排 序 ` 归并 排序 和 基数 排序 。 
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排序 的 基本 概念 小 


假设 被 排序 的 数据 是 由 一 组 元 素 组 成 的 表 ,而 元 素 由 若干 个 数据 项 组 成 ,其 中 指定 一 个 
数据 项 为 关键 字 , 关 键 字 用 作 排 序 运算 的 依据 。 不 同 于 上 一 章 的 查找 ,这 里 的 关键 字 是 可 以 
重复 的 ,也 就 是 说 ,在 排序 表 中 可 能 存在 关键 字 相 同 的 两 个 或 者 多 个 元 素 。 

所 谓 排序 (sort) ,就 是 要 整理 表 中 的 元 素 , 使 之 按 关 键 字 递增 或 递减 有 
序 排 列 , 本 章 仅 讨论 递增 排序 的 情况 。 其 确切 定义 如 下 : 

输入 :个 元 素 ,Ro ,Ri,…,R,-1, 其 相应 的 关键 字 分 别 为 ko ,ki，…， 
i 

输出 : Ri ,Ri ,… ,Ri_， ,使 得 ki 二 ks 过 …<<k_，。 

















视频 讲解 


因此 ,排序 算法 就 是 要 确定 0,1,…,n 一 1 的 一 种 排列 i 有,…,-:, 使 表 中 的 元 素 依 此 
排列 整理 后 按 关键 字 有 序 。 
2 证 的 和 定 作 


当 待 排序 元 素 的 关键 字 均 不 相同 时 ,显然 排序 结果 是 唯一 的 ,否则 排序 的 结果 不 一 定 叭 
一 。 如 果 待 排序 的 表 中 存在 有 多 个 关键 字 相 同 的 元 素 , 经 过 排序 后 这 些 具 有 相同 关键 字 的 
元 素 之 间 的 相对 次 序 保持 不 变 , 则 称 这 种 排序 方法 是 稳定 的 (stable); 反之 , 若 具 有 相同 关 
键 字 的 元 素 之 间 的 相对 次 序 发 生变 化 , 则 称 这 种 排序 方法 是 不 稳定 的 (unstable)。 注 意 , 排 
序 算法 的 稳定 性 是 针对 所 有 输入 实例 而 言 的 。 也 就 是 说 ,在 所 有 可 能 的 输入 实例 中 ,只 要 有 
一 个 实例 使 得 算法 不 满足 稳定 性 要 求 , 则 该 排序 算法 就 是 不 稳定 的 。 

在 排序 过 程 中 , 若 整个 表 都 放 在 内 存 中 处 理 ,排序 时 不 涉及 数据 的 内 、 外 存 交 换 , 则 称 之 
为 内 排序 (internal sort); 反之 , 若 在 排序 过 程 中 要 进行 数据 的 内 .外 存 交换 , 则 称 之 为 外 
排序 (external sort) 。 内 排序 适用 于 元 素 个 数 不 是 很 多 的 小 表 , 外 排序 则 适用 于 元 素 个 数 
很 多 ,不 能 一 次 将 其 全 部 元 素 放 和 人 内 存 的 大 表 。 内 排序 是 外 排序 的 基础 ,本 章 只 讨论 内 
排序 。 

按 所 用 的 策略 不 同 ,内 排序 方法 可 以 分 为 需要 关键 字 比 较 和 不 需要 关键 字 比 较 两 类 。 
需要 关键 字 比 较 的 排序 方法 有 插入 排序 选择 排序 ,交换 排序 和 归并 排序 等 ; 不 需要 关键 字 
比较 的 排序 方法 有 基数 排序 等 。 


在 基于 比较 的 排序 算法 中 主要 进行 以 下 两 种 基本 操作 。 

。 比较 (compare) : 关键 字 之 间 的 比较 。 

。 移动 (move) : 元 素 从 一 个 位 置 移动 到 另 一 个 位 置 。 

排序 算法 的 性 能 由 算法 的 时 间 和 空间 确定 ,而 时 间 是 由 比较 和 移动 的 次 数 确定 的 ,如 两 
个 元 素 的 一 次 交换 需要 3 次 移动 。 





@0@, 内 排 序 





车 待 排序 元 素 的 关键 字 顺 序 正好 和 排序 顺序 相同 , 称 此 表 中 元 素 为 正 序 ; 反之 , 若 待 排 
序 元 素 的 关键 字 顺 序 正 好 和 排序 顺序 相反 , 称 此 表 中 元 素 为 反 序 。 

下 面 分 析 基 于 比较 的 排序 算法 最 快 有 多 快 。 假 设 有 3 个 记录 (Ri ,Rs。 ,Rs), 对 应 的 关键 
字 为 ( ,ks ,ks) ,基于 比较 的 排序 方法 是 ,车 三 ks ,序列 不 变 ; 否则 交换 R 和 Rs , 变 为 序 
列 (R, ,Ri ,Rs)。 如 此 这 样 ,所 有 情况 的 排序 过 程 构成 一 棵 如 图 10. 1 所 示 的 判定 树 ,排序 的 
结果 有 6(31) 种 情况 ,每 个 分 支 对 应 一 次 关键 字 比 较 , 从 根 结 点 到 某 个 叶子 结 点 是 一 种 序列 
的 排序 情况 ,所 需 比较 次 数 为 该 叶子 结 点 的 层次 一 1, 如 情况 需要 两 次 比较 (最 好 情况 ) , 情 
况 @ 需 要 3 次 比较 (最 坏 情况 ) ,最 坏 情况 也 不 超过 树 的 高 度 。 平 均 比较 次 数 是 所 有 6 种 情 
况 的 平均 值 ,这 里 为 (2 十 3 十 3 十 2 十 3 十 3)/6 二 2. 67 次 。 
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图 10.1 排序 的 判定 树 


推广 一 下 ,对 于 ?个 元 素 排 序 结果 有 xz4 种 情况 ,对 应 的 判定 树 是 一 棵 有 xz4 个 叶子 
结 点 的 高 度 最 小 的 二 叉 树 ,其 中 单 分 支 结 点 个 数 为 0, 结 点 总 数 二 mo 十 ns 二 2n!1 一 1。 设 
其 高 度 为 六 ,可 以 求 出 A= [log:2z1!] = log:zl| 十 1, 对 应 的 关键 字 比 较 次 数 最 多 为 由 一 1 即 
[logzn! |], 可 以 计算 出 [logsn! | 之 nlogsn, 即 hnlogsn。 

以 上 推出 ,从 平均 情况 看 ,大 约 需 要 nlogsn 次 关键 字 比 较 ( 所 有 n! 种 排序 情况 的 关键 
字 比 较 次 数 的 平均 值 ), 移 动 次 数 也 是 同样 的 数量 级 ,所 以 排序 的 平均 时 间 复 杂 度 为 
Onlogzn) , 即 基于 比较 的 排序 算法 最 好 的 平均 时 间 复 杂 度 为 O(nlogsn)。 也 就 是 说 ,如 果 
采用 基于 比较 的 方法 对 任意 的 个 元 素 排序 ,最 好 的 平均 时 间 复 杂 度 为 O(nlogsn)。 后 面 
介绍 的 堆 排 序 、 二 路 归并 排序 和 快速 排序 都 属于 这 一 类 好 的 排序 算法 。 

在 本 章 中 以 顺序 表 作为 排序 数据 的 存储 结构 。 为 简单 起 见 ,假设 关键 字 的 类 型 为 整 型 。 
待 排 序 的 顺序 表 中 数据 元 素 的 类 型 声明 如 下 : 


typedef int KeyType; // 定 义 关键 字 类 型 为 int 
typedef struct // 元 素 类 型 
{ KeyType key; // 关 键 字 项 

InfoType data; // 其 他 数据 项 ,类 型 为 InfoType 


} RecType; // 排 序 元 素 的 类 型 
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插入 排序 的 基本 思想 是 : 每 次 将 一 个 待 排序 的 元 素 按 其 关键 字 大 小 插入 到 前 面 已 经 排 
好 序 的 子 表 中 的 适当 位 置 , 直 到 全 部 元 素 插入 完成 为 止 。 本 节 介 绍 3 种 插入 排序 方法 , 即 直 
接 插 入 排序 , 折 半 插入 排序 和 和 希 尔 排 序 。 


1021 直接 插入 排序 
RR 一 


假设 待 排序 的 元 素 存放 在 数组 RL0..n 一 1] 中 ,在 排序 过 程 的 某 一 中 间 扫 -- 扫 
时 刻 ,R 被 划分 成 两 个 子 区 间 R[L0..i 一 1 和 R[i..n 一 1], 其 中 前 一 个 子 区 间 t 
是 已 排 好 序 的 有 序 区 (ordered region) ,后 一 个 子 区 间 则 是 当前 未 排序 的 部 
分 ,不 妨 称 其 为 无 序 区 (disordered region) ,初始 时 i 二 1, 有 序 区 只 有 R[0] Er 
一 个 元 素 。 视频 讲解 
直接 插入 排序 (straight insertion sort) 的 一 趟 操作 是 将 当前 无 序 区 的 开头 

元 素 R[ 可 (过 i 委 2 一 1D) 插 入 到 有 序 区 RL[0..i 一 1] 中 的 适当 位 置 ,使 R[0.. 门 变 为 新 的 有 序 
区 ,如 图 10. 2 所 示 。 这 种 方法 通常 称 为 增 量 法 ,因为 它 每 次 使 有 序 区 增加 一 个 元 素 。 






































有 序 区 无 序 区 对 于 第 i 趋 排序 ,如 何 将 无 序 区 的 第 一 个 元 素 
[0a | [RR | 。 RC] 插 入 到 有 序 区 呢 ?其 过 程 是 先 将 R[ 站 暂 放 到 tmp 
5 - 中 ,j 在 有 序 区 中 从 后 向 前 找 ( 初 值 为 :一 1) ,凡是 关键 
岂 一 二 笃 字 大 于 tmp. key 的 记录 均 后 移 一 个 位 置 。 若 找到 某 个 
R[0] … R[i-1] RD | RLi+1] … RIn-1] | R[ 站 ,其 关键 字 小 于 或 等 于 tmp. key, 则 将 tmp 放 在 它 
有 序 区 无 序 区 们 后 面 , 即 置 RL 十 1]==tmp。 
初始 时 有 序 区 只 有 AR[O] 元 素 说 明 : 直接 插入 排序 每 趟 产生 的 有 序 区 并 不 一 定 
FE 序 趟 次 i: 1~n-1 
I 是 全 局 有 序 区 ,也 就 是 说 有 序 区 中 的 元 素 并 不 一 定 放 
图 10.2 直接 插入 排序 的 一 未 。 ”在 最 终 的 位 置 上 。 当 一 个 元 素 在 整个 排序 结束 前 就 已 
折 记 对 各 经 放 在 其 最 终 位 置 上 称 为 归 位 (homing)。 
2 排序 算 滨 
直接 插入 排序 的 算法 如 下 ， 
void InsertSort(RecType RD] ,int n) // 对 了 R[0..n 一 巧 按 递增 有 序 进行 直接 插入 排序 


{ inti, j; RecType tmp; 
for (i 王 1;i< nii 十 十 ) 


{ if (RI].key<R[i—1].key) // 反 序 时 
np Rl 
j=i—1; 
do // 找 R 加 的 插入 位 置 


Ry RD: // 将 关键 字 大 于 RD.key 的 记录 后 移 
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= 
} while G>=0 && RO].key> tmp.key); 
RDG+1]=tmp; // 在 j 十 1 处 插入 RO 


} 


3 算法 分 析 

若 初始 数据 序列 按 关键 字 递 增 有 序 即 正 序 , 则 在 每 一 趟 排序 中 仅 需 进行 一 次 关键 字 的 
比较 ,因为 每 趟 排序 均 不 进入 内 循环 。 由 此 可 知 , 正 序 时 插入 排序 的 关键 字 间 比较 次 数 和 元 
素 移动 次 数 均 达到 最 小 值 Css 和 Min 。 











Cun = 21 一 7 一 1，Mu 一 0 


反之 , 若 初始 数据 序列 按 关键 字 递 减 有 序 即 反 序 , 则 每 趟 排序 中 ,因为 当前 有 序 区 
R[0..i 一 1] 中 的 关键 字 均 大 于 待 插 元 素 R[ 站 的 关键 字 , 所 以 内 循环 需要 将 待 插 元 素 tmp 的 
关键 字 和 RL[0..i 一 1] 中 全 部 的 关键 字 进 行 比较 ,这 需要 进行 i 次 关键 字 比 较 ; 显然 内 循环 里 
需 将 RL[0..i 一 1] 中 的 所 有 元 素 均 后 移 , 共 (i 一 1) 一 0 十 1==i 次 移动 ,外 加 tmp 王 R[ 门 与 
R[j 十 1] 二 tmp 的 两 次 移动 ,一 趟 排序 所 需 移动 元 素 的 总 数 为 ?十 2。 由 此 可 知 , 反 序 时 插入 
排序 的 关键 字 间 比较 次 数 和 元 素 移动 次 数 均 达到 最 大 值 Cu 和 Mw。 

C= Di D0 证 二 


i=1 





1 


Ma = 2) it2 = tt = 00) 


在 平均 情况 下 ,R[ 可 (1<i 生 一 1) 插 入 到 有 序 区 RL0..i 一 1]( 其 中 有 i 个 元 素 ) 时 平均 
的 比较 次 数 为 i/2, 平 均 移动 元 素 的 次 数 为 i/2 十 2, 故 总 的 比较 和 移动 元 素 次 数 约 为 : 
3 坪 十 讨 +2 一 D4 = 21 w+ 和 oo) 
i=1 2 


iel 


由 上 述 分 析 可 知 , 当 初始 数据 序列 不 同时 ,直接 插入 排序 所 耗费 的 时 间 有 很 大 差异 。 最 
好 情况 是 表 初 态 为 正 序 ,此 时 算法 的 时 间 复 杂 度 为 O(n) ,最 坏 情 况 是 表 初 态 为 反 序 , 相 应 的 
时 间 复 杂 度 为 O(n*)。 算 法 的 平均 时 间 复 杂 度 也 是 O(n? ) ,也 就 是 说 ,算法 的 平均 时 间 复 杂 
度 接近 最 坏 情况 。 

直接 插入 排序 算法 中 只 使 用 ij 和 tmp 这 3 个 辅助 变量 ,与 问题 规模 无关, 故 辅 助 空 





间 复 杂 度 为 0(1) ,也 就 是 说 , 它 是 一 个 就 地 排序 算法 。 Le 


另外 , 当 i>j 且 R[ 站 .key 二 RLJ. key 时 ,本 算法 将 RCI 插入 到 RL[j] 的 后 面 ,使 R[] 
和 R[ 站 的 相对 位 置 保持 不 变 , 所 以 直接 插入 排序 是 一 种 稳定 的 排序 方法 。 

【 例 10.1】 设 待 排序 的 表 有 10 个 元 素 , 其 关键 字 分 别 为 (9,8,7,6,5,4,3,2,1,0) ,说 
明 采 用 直接 插入 排序 方法 进行 排序 的 过 程 。 

其 直接 插入 排序 过 程 如 图 10. 3 所 示 。 图 中 用 带 阴 影 的 部 分 表示 当前 的 有 序 区 ,每 
趟 都 向 有 序 区 中 插入 一 个 元 素 , 并 保持 其 有 序 性 。 
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图 10.3 直接 插入 排序 的 过 程 
1022 折 半 插入 排序 


直接 插入 排序 中 将 无 序 区 的 开头 元 素 R[ 门 (1 志 i<n 一 1) 插 入 到 有 序 区 RL0..i 一 1] 是 采 
用 顺序 比较 的 方法 。 由 于 有 序 区 的 元 素 是 有 序 的 ,可 以 采用 折 半 查找 方法 先 在 RL[0..i 一 1] 
中 找到 插入 位 置 ,再 通过 移动 元 素 进 行 插入 ,这 样 的 插入 排序 称 为 折 半 插入 排序 (binary 
insertion sort) 或 二 分 插入 排序 。 扫 一 扫 

第 i 趟 在 R[low..high]( 初 始 时 low 二 0,high 二 i 一 1) 中 采用 折 半 查找 
方法 查找 搬入 R[ 门 的 位 置 为 REhigh 十 1]. 再 将 R[high 十 1..i 一 1] 元 素 后 移 
一 个 位 置 ,并 置 RLhigh 十 1]==R[]。 

说 明 : 和 直接 插入 排序 一 样 , 折 半 插入 排序 每 赵 产 生 的 有 序 区 并 不 一 视频 讲解 
定 是 全 局 有 序 区 。 


2 者 序 算 六 


折 半 插入 排序 的 算法 如 下 : 





void BinInsertSort(RecType R[] ,int n) 
{ inti,j,low, high, mid; 


RecType tmp; 
for (i=lsisnit by 
{ if(R[].key<R[i—1].key) // 反 序 时 
{ tmp=R[]; // 将 民国 保存 到 tmp 中 
low=0; high=i—1; 
while (low <=high) // 在 RDlow..high] 中 查找 插入 的 位 置 
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{ mid=(lowt+high)/2; // 取 中 间 位 置 
Rn 
high=mid—1; // 插 入 点 在 左 半 区 
else 
low 一 mid 十 1; // 插 入 点 在 右 半 区 
} // 找 位 置 high 
for G=i—1;j>=high+1;j——) // 集 中 进行 元 素 后 移 
ROG+1]=RO]; 
R[hight+1]=tmp; // 插 入 tmp 


} 
} 


3~ 算 法 分 析 

折 半 插入 排序 的 元 素 移动 次 数 与 直接 插入 排序 相同 ,不 同 的 仅 是 变 分 散 移动 为 集中 移 
动 。 在 RLO..i 一 1](i 个 元 素 ) 中 查找 插入 R[ 门 的 位 置 , 折 半 查找 的 平均 关键 字 比 较 次 数 约 
为 log: (i 十 1) 一 1, 平 均 移动 元 素 的 次 数 为 i/2 十 2, 所 以 平均 时 间 复 杂 度 为 : 


nl 四 
> (log, ;i 十 1 = 证 中 读书 区 = O(n’) 
1 


实际 上 , 折 半 插入 排序 和 直接 插入 排序 相 比 移动 元 素 的 性 能 没有 改善 ,仅仅 减少 了 关键 
字 的 比较 次 数 。 就 平均 性 能 而 言 , 由 于 折 半 查找 优 于 顺序 查找 ,所 以 折 半 插入 排序 也 优 于 直 
接 搬入 排序 。 折 半 插 入 排序 的 空间 复杂 度 为 0(1) ,也 是 一 种 稳定 的 排序 方法 。 


1023 希 尔 排序 


希 尔 排序 (shell sort) 也 是 一 种 插入 排序 方法 ,实际 上 是 一 种 分 组 插入 方法 。 其 基本 思 
想 是 先 取 一 个 小 于 的 整数 di 作为 第 一 个 增 量 ,把 表 的 全 部 元 素 分 成 di 个 组 ,将 所 有 距离 
为 d 的 倍数 的 元 素 放 在 同一 个 组 中 ,图 10. 4 是 分 为 d 的 情况 。 在 各 组 内 进行 直接 插入 排 
序 ; 然后 取 第 2 个 增 量 ds (过 内 ), 重 复 上 述 的 分 组 和 排序 ,直到 所 取 的 增 量 d 三 
1(d 二 wd- 过 … 二 凡生 d), 即 所 有 元 素 放 在 同一 组 中 进行 直接 搬入 排序 为 止 。 所 以 看 尔 排 
序 称 为 减少 增 量 的 排序 方法 。 
第 1 组 [RI0],， RId], RDd, …，  R[kA] f=md-1 














第 2 组 |R[], R[1+d]， R[1+2d], …,  R[1+kd] 








第 i 组 |R[i-1]， R[i-1+d]，R[i-1+2d], …， R[i-l+kd] 

















第 d 组 [RIa-1], R24-1], R[34-1], …， RI(kt1)d-1] 

















每 组 中 相 邻 的 两 个 元 素 相距 4 个 位 置 


图 10.4 和 希 尔 排序 时 分 为 a 组 
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每 一 趟 希 尔 排序 从 元 素 RLd] 开 始 起 ,采用 直接 插入 排序 ,直到 元 素 R[n 一 1] 为 止 。 每 
个 元 素 的 比较 和 插入 都 在 同 组 内 部 进行 ,对 于 元 素 R[ 避 , 同 组 的 前 面 的 元 素 有 { R[j] | 7 一 
1 一 4 过 0) 。 

说 明 : 希 尔 排 序 每 趋 并 不 产生 有 序 区 ,在 最 后 一 趋 排序 结束 前 ,所 有 元 素 并 不 一 定 归 位 
了 ,但 是 在 希 尔 排 序 每 趟 完成 后 数据 越 来 越 接 近 有 序 。 

CR 


取 二 n/2,dit1 二 Ldi/2」| 时 的 希 尔 排 序 算法 如 下 : 


void ShellSort( RecType R[] ,int n) // 希 尔 排序 算法 


{ inti,j,d; 
RecType tmp; 
d=n/2; // 增 量 置 初 值 
while (d>0) 
{ for (i=dii<nii 十 十 ) // 对 所 有 组 采用 直接 插入 排序 
{ tmp=R[]; // 对 相隔 d 个 位 置 一 组 采用 直接 插入 排序 
j=i—d; 
while (j >=0 && tmp. key < ROD].key) 
{ ROG+dj=RD]; 
| 
} 
RD 十 加 =tmp; 
} 
d=d/2; // 减 小 增 量 
} 
} 
3. 算法 分 析 


希 尔 排序 法 的 性 能 分 析 是 一 个 复杂 的 问题 ,因为 它 的 时 间 是 所 取 “ 增 量 " 序 列 的 函数 ,到 
目前 为 止 增 量 的 选取 无 一 定论 。 但 无 论 增 量 序列 如 何 取 , 最 后 一 个 增 量 必须 等 于 1。 如 果 
按照 上 述 算法 的 取 法 , 即 di 二 n/2,dit1 二 Ldi/2j (i 宇 1) ,也 就 是 说 ,每 次 后 一 个 增 量 是 前 一 
个 增 量 的 1/2, 则 经 过 1 二 logs(n 一 1) 次 后 d, 二 1。 希 尔 算法 的 时 间 复 杂 度 难以 分 析 ,一般 认 
为 其 平均 时 间 复 杂 度 为 O(n )。 希 尔 排 序 的 速度 通常 要 比 直接 插入 排序 快 。 

分 析 希 尔 排 序 过 程 ,可 以 看 到 当 增 量 d= 1 时 希 尔 排序 和 直接 插入 排序 基本 一 致 。 为 
什么 希 尔 排 序 的 时 间 性 能 优 于 直接 插入 排序 呢 ? 一 方面 ,直接 插入 排序 在 初始 数据 为 正 序 
时 所 需 的 时 间 最 少 ; 另 一 方面 , 当 n 值 较 小 时 ,n 和 n? 的 差别 也 较 小 , 即 直接 插入 排序 的 最 
好 时 间 复 杂 度 O(n) 和 最 坏 时 间 复 杂 度 OG?) 差别 不 大 。 在 希 尔 排 序 开始 时 增 量 di 较 大 ， 
分 组 较 多 ,每 组 的 元 素数 目 少 ; 故 各 组 内 直接 插入 较 快 ,后 来 增 量 d; 逐渐 缩小 ,分 组 数 逐 渐 
减少 ,而 各 组 的 元 素数 目 逐 渐 增多 ,但 由 于 已 经 按 di-: 作 为 距离 排 过 序 ,使 数据 接近 于 有 序 
状态 ,所 以 新 的 一 趟 排序 过 程 也 较 快 。 因 此 ,和 希 尔 排 序 在 效率 上 较 直 接 插入 排序 有 很 大 的 
改进 。 

例如 有 n(n 二 10) 个 元 素 进行 递增 排序 ,在 采用 直接 插入 排序 时 平均 时 间 大 约 为 10’ 一 
100。 而 采用 希 尔 排序 ,di 二 5, 分 为 5 组 ,每 组 两 个 元 素 ,执行 时 间 大 约 为 5X2: 二 20; 心 一 2， 
分 为 两 组 ,每 组 5 个 元 素 ,执行 时 间 大 约 为 2X5 二 50; ds 二 1, 分 为 一 组 ,每 组 10 个 元 素 ,但 
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此 时 数据 序列 基本 正 序 , 直 接 插入 排序 呈现 最 好 性 能 ,执行 时 间 大 约 为 1]X10 王 10。 累 计 起 
来 , 希 尔 排序 的 时 间 大 约 为 80, 好 于 直接 插入 排序 。 

在 希 尔 排序 算法 中 只 使 用 ij、d 和 tmp 这 4 个 辅助 变量 ,与 问题 规模 无关, 故 辅助 空 
间 复 杂 度 为 0(1) ,也 就 是 说 它 是 一 个 就 地 排序 。 

另外 , 希 尔 排序 法 是 一 种 不 稳定 的 排序 算法 。 例 如 ,车 希 尔 排 序 分 为 {3,10,7,|8|,20} 和 
{5,8,2,1,6}) 两 组 ,显然 第 1 组 的 |8| 排 列 在 第 2 组 的 8 的 后 面 ,两 组 采用 直接 插入 排序 后 的 
结果 为 {3,7,|8|,10,20} 和 {1,2,5,6,8) ,这 样 第 1 组 的 |8| 排 列 到 第 2 组 的 8 的 前 面 ,它们 的 
相对 位 置 发 生 了 改变 。 

说 明 : 一 般 情况 下 ,一 个 排序 算法 在 排序 过 程 中 需要 以 较 大 的 间隔 交换 元 素 或 者 把 元 
素 移动 一 个 较 大 的 距离 时 该 排序 方法 是 不 稳定 的 ,因为 可 能 会 把 原来 排 在 前 面 的 元 素 移动 
到 具有 相同 关键 字 的 另 一 个 元 素 的 后 面 。 证 明 一 个 排序 算法 是 不 稳定 的 ,只 需要 给 出 一 个 
反例 即 可 ; 反之 ,需要 给 出 证 明 过 程 。 

【 例 10.2】 设 待 排序 的 表 有 10 个 元 素 ,其 关键 字 分 别 为 (9,8,7,6,5,4,3,2,1,0) ,说 
明 采 用 希 尔 排序 方法 进行 排序 的 过 程 。 

其 排序 过 程 如 图 10. 5 所 示 。 第 1 趟 排序 时 ,d=5, 整 个 表 被 分 成 5 组 , 即 (9,4)、 
(8,3)、(7,2)、(6,1)、(5,0), 各 组 采用 直接 插入 排序 方法 变 成 有 序 的 , 即 结果 分 别 为 (4,9)、 
(3,8)、 (2,7)、(1,6)、(0,5), 最 终结 果 为 (4,3,2,1,0,9,8,7,6,5)。 

第 2 趟 排序 时 ,d= 二 2, 整 个 表 分 成 两 组 , 即 (4,2,0,8,6) 和 (3,1,9,7,5), 各 组 采用 直接 
插入 排序 方法 变 成 有 序 的 , 即 结 果 分 别 为 (0,2,4,6,8) 和 (1,3,5,7,9)。 

第 3 趟 排序 时 ,d=1, 整 个 表 为 一 组 ,采用 直接 插入 方法 使 整个 数列 有 序 , 最 终结 果 为 
(0,1,2,3,4,5,6,7,8,9) 。 
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交换 排序 的 基本 思想 是 两 两 比较 待 排序 元 素 的 关键 字 ,发 现 这 两 个 元 素 的 次 序 相反 
时 即 进行 交换 ,直到 没有 反 序 的 元 素 为 止 。 本 节 介绍 两 种 交换 排序 , 即 冒 泡 排 序 和 快速 
排序 。 


1031 冒 泡 排序 


冒 泡 排序 (bubble sort) 也 称 为 气泡 排序 ,是 一 种 典型 的 交换 排序 方法 ,其 基本 思想 是 通 
过 无 序 区 中 相 邻 元 素 关键 字 间 的 比较 和 位 置 的 交换 使 关键 字 最 小 的 元 素 如 气泡 一 般 逐 渐 往 
上 “漂浮 ”直至 “水 面 ”。 

整个 算法 从 最 下 面 的 元 素 开 始 , 对 每 两 个 相 邻 的 关键 字 进 行 比较 , 且 使 关键 字 较 小 的 元 
素 换 至 关键 字 较 大 的 元 素 之 上 ,使 得 经 过 一 赵 冒 泡 排 序 后 关键 字 最 小 的 元 素 到 达 最 上 端 ,如 
图 10. 6 所 示 。 接 着 ,在 剩 下 的 元 素 中 找 关 键 字 次 小 的 元 素 , 并 把 它 换 至 第 二 个 位 置 上 。 依 





























此 类 推 , 直 到 所 有 元 素 都 有 序 为 止 。 
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R[n-1] Rln-1] 























图 10.6 冒 泡 排序 的 一 趟 排序 过 程 
有 序 区 是 全 局 有 序 的 ,初始 时 为 空 ,排序 趟 次 i 0 一 2 一 2 


说 明 : 冒 泡 排序 每 趟 产生 的 有 序 区 一 定 是 全 局 有 序 区 ,也 就 是 说 每 趟 产生 的 有 序 区 中 
的 所 有 元 素 都 归 位 了 。 


2 排序 算 关 


冒 泡 排序 的 算法 如 下 : 





void BubbleSort( RecType RD ,int n) 
{ inti,j; 
for (i=0;i<n—1;i+t 十 ) 
tor n= 1 // 将 有 器 元 素 归 位 
if (RD].key<RO—1].key) // 相 邻 的 两 个 元 素 反 序 时 
swap(RD] ,RD 一 切 ); // 将 R 中 和 RD 一 巧 两 个 元 素 交 换 
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【 例 10.3】 设 待 排序 的 表 有 10 个 元 素 , 其 关键 字 分 别 为 (9,8,7,6,5,4,3,2,1,0), 说 
明 采 用 冒 泡 排序 方法 进行 排序 的 过 程 。 

其 排序 过 程 如 图 10. 7 所 示 ,每 次 从 无 序 区 中 冒 出 一 个 最 小 关键 字 的 元 素 并 将 其 定 
位 (图 中 用 带 阴 影 的 部 分 表示 当前 的 有 序 区 ) 。 
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10.7 冒 泡 排序 过 程 


在 有 些 情况 下 ,在 第 i(i<n 一 1) 赵 时 已 排 好 序 了 ,但 仍 执行 后 面 几 趋 的 比较 。 实 际 上 ， 
一 旦 算法 中 的 某 一 趟 比较 时 不 出 现任 何 元 素 交 换 , 说 明 已 排 好 序 了 ,就 可 以 结束 本 算法 。 为 
此 ,改进 冒 泡 排序 算法 如 下 : 


void BubbleSortl (RecType R[] ,int n) 
Os 





bool exchange; 
for (i=0si<n—1;it+) 
{ exchange=false; // 一 趋 前 exchange 置 为 假 
for (j=n—1;j>i;j——) // 归 位 R 口 ,循环 n 一 一 1 次 
让 (R 四 ].key<RD 一 1].key) // 相 邻 两 个 元 素 反 序 时 I 
{ swap(RD],RD 一 1 了 J); /将 RD 和 RD 一 巧 两 个 元 素 交 换 
exchange 一 truei // 一 旦 有 交换 ,exchange 置 为 真 
} 
if (lexchange) // 本 趟 没有 发 生 交 换 , 中途 结束 算法 


return; 


375 





数据 结构 教程 \ 目 GO 





若 初始 数据 序列 是 正 序 的 , 则 一 直 扫 措 即 可 完成 排序 ,所 需 的 关键 字 比 较 和 元 素 移 动 的 
次 数 均 分 别 达到 最 小 值 : 
Cmn 一 7 一 1， Mrn=0 
车 初始 数据 序列 是 反 序 的 , 则 需要 进行 一 1 赵 排 序 , 每 赵 排 序 要 对 无 序 区 R[i..n 一 1] 
中 的 w 一 i 个 元 素 两 两 比 较 ,比较 次 数 为 4 一 ;一 1(0 过 i 过 n 一 2) , 且 每 次 比较 都 必须 移动 元 素 
3 次 来 达到 交换 元 素 位 置 的 目的 。 在 这 种 情况 下 ,比较 和 移动 次 数 均 达到 最 大 值 ; 


m2 


Coms = 3) il = = On’) 


i=0 




















nr2 
Ma = >)3 7 一 i 十 1 
i=0 


平均 情况 分 析 稍 微 复杂 一 些 , 因 为 算法 可 能 在 中 间 的 某 一 道 排序 完成 后 就 终止 ,但 可 以 
证 明 平均 的 排序 趟 数 仍 是 O0z) ,由 此 得 出 平均 情况 下 总 的 比较 次 数 仍 是 O(n ) , 故 算 法 的 
平均 时 间 复 杂 度 为 OC? ) 。 

由 上 述 分 析 可 知 , 当 初始 数据 序列 不 同时 冒 泡 排序 所 耗费 的 时 间 有 很 大 差异 。 最 好 情 
况 是 表 初 态 为 正 序 , 此 时 算法 的 时 间 复 杂 度 为 O(n) ,最 坏 情况 是 表 初 态 为 反 序 , 相 应 的 时 间 
复杂 度 为 O(n*)。 算 法 的 平均 时 间 复杂 度 也 是 O(0z2 ) ,也 就 是 说 ,算法 的 平均 时 间 复 杂 度 接 
近 最 坏 情 况 。 虽 然 冒 泡 排序 不 一 定 要 进行 n 一 1 趟 ,但 由 于 它 的 元 素 移动 次 数 较 多 ,一 般 平 
均 时 间 性 能 要 比 直接 插入 排序 差 。 

在 冒 泡 排序 算法 中 只 使 用 zy 和 tmp 这 3 个 辅助 变量 ,与 问题 规模 无关, 故 辅助 空间 
复杂 度 为 0(1) ,也 就 是 说 它 是 一 个 就 地 排序 。 

另外 , 当 i>j 且 R[ 站 . key 二 RLjJj. key 时 ,两 者 没有 逆序 ,不 会 发 生 交换 ,也 就 是 说 使 
R[ 杂 和 R[7] 的 相对 位 置 保持 不 变 ,所 以 冒 泡 排序 是 一 种 稳定 的 排序 方法 。 


1032 快速 排序 


快速 排序 (quick sort) 是 由 冒 泡 排 序 改 进而 得 的 , 它 的 基本 思想 是 在 待 排 序 的 个 元 素 
中 任 取 一 个 元 素 ( 通 常 取 第 一 个 元 素 ) 作 为 基准 ,把 该 元 素 放 入 适当 位 置 后 ,数据 序列 被 此 元 
素 划分 成 两 部 分 。 所 有 关键 字 比 该 元 素 关键 字 小 的 元 素 放 置 在 前 一 部 分 ,所 有 比 它 大 的 元 
素 放置 在 后 一 部 分 ,并 把 该 元 素 排 在 这 两 部 分 的 中 间 ( 称 为 该 元 素 归 位 ) ,这 个 过 程 称 为 一 趟 
快速 排序 , 即 一 趟 划分 。 

之 后 对 产生 的 两 个 部 分 分 别 重复 上 述 过 程 , 直 至 每 部 分 内 只 有 一 个 元 素 或 空 为 止 。 简 
而 言 之 ,每 趟 使 表 的 第 一 个 元 素 放 和 人 适当 位 置 ,将 表 一 分 为 二 ,对 子 表 按 递归 方式 继续 这 种 
划分 ,直至 划分 的 子 表 的 长 为 1 或 0。 

一 趟 快速 排序 的 划分 过 程 partitionCR,s,O 是 采用 从 两 头 向 中 间 扫 描 的 办 
法 ,同时 交换 与 基准 元 素 逆序 的 元 素 ( 参 见 第 2 章 的 例 2. 4) 。 具 体 方法 是 设 两 
个 指示 器 i 和 j, 它 们 的 初 值 分 别 为 指向 无 序 区 中 的 第 一 个 和 最 后 一 个 元 素 。 
假设 无 序 区 中 的 元 素 为 REsj],R[s 十 1],…,R[]j, 则 i 的 初 值 为 ,i 的 初 值 为 
+ ,首先 将 RLs] 移 至 变量 tmp 中 作为 基准 , 令 7 自 位 置 : 起 向 前 扫描 直至 


3n(n— 1) 2 
了 OG ) 
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尺 [j]. key 二 tmp. key 时 将 RLj] 移 至 位 置 i, 然 后 让 i 向 后 无 序 区 R[s.…1] 
扫描 直至 R[ 门 . key 二 tmp. key 时 将 R[ 门 移 至 位 置 j, 依 此 RE] RIs+1] ny RI 








重复 直至 i==j, 此 时 所 有 R[k](k 二 s,s 十 1,… ,i 一 1) 的 关键 
字 都 小 于 tmp. key, 而 所 有 R[R](R==i 十 1,i 十 2,… ,1) 的 关 
键 字 必 大 于 tmp. key, 此 时 再 将 tmp 中 的 元 素 移 至 位 置 i， 多 RR [RH … RI 
它 将 无 序 区 中 的 元 素 分 割 成 REs..i 一 了 和 RCi+1.. ,以便 大 人 和 
分 别 进行 排序 ,如 图 10. 8 所 示 。 图 10.8 快速 排序 的 一 趟 划分 过 程 
说 明 : 快速 排序 每 趋 仅 将 一 个 元 素 归 位 。 
显然 ,快速 排序 是 一 个 递归 过 程 ,其 递归 模型 如 下 : 


几 - 趟 排序 




















f(R,s,t) 三 不 做 任何 事情 当 R[s..t] 中 没有 元 素 或 者 只 有 一 个 元 素 时 
f(R, s, t) i= partition(R, s, 1); 其 他 情况 
RRA Ds 
RI 
Cd 
快速 排序 算法 如 下 : 
int partition( RecType R[] ,int s,int t) // 一 趟 划分 
{ int i=s,j=t; 
RecType tmp=R[]; // 以 及 口 为 基准 
while (i<j) // 从 两 端 交替 向 中 间 扫 描 , 直 至 i=j 为 止 


{ while (Gj>i&& RO].key>=tmp.key) 


= // 从 右 向 左 扫 描 , 找 一 个 小 于 tmp. key 的 RDO] 
R[J=RD]; // 找 到 这 样 的 RDO], 放 入 R 口 处 
while (i<j && R[].key<=tmp. key) 
[a // 从 左 向 右 扫 描 , 找 一 个 大 于 tmp. key 的 RD 
RO]=R[D; // 找 到 这 样 的 RD, 放 入 R 四 处 
} 
R[]=tmp; 
return i; 


} 
void QuickSort(RecType R[],int s,int tb) ” // 对 Rs.. 曲 的 元 素 进行 快速 排序 


人 
if (s<t) // 区 间 内 至 少 存在 两 个 元 素 的 情况 
{ i=partition(R, s,t); 
QuickSort(R, s,i—1); // 对 左 区 间 递归 排序 
QuickSort(R,it1,t); // 对 右 区 间 递归 排序 





} 


【 例 10.4】 设 待 排序 的 表 有 10 个 元 素 , 其 关键 字 分 别 为 (6,8,7,9,0,1,3,2,4,5), 说 
明 采 用 快速 排序 方法 进行 排序 的 过 程 。 

其 排序 过 程 如 图 10.9 所 示 。 第 1 趟 是 以 6 为 关键 字 将 整个 区 间 分 为 (5,4,2,3,0,1) 
和 (9,7,8) 两 个 子 区 间 ,并 将 6 元 素 归 位 ; 对 于 每 个 子 区 间 , 又 进行 同样 的 排序 ,直到 该 子 区 
间 只 有 一 个 元 素 或 不 存在 元 素 为 止 。 
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10.9 快速 排序 过 程 
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最 后 结果 如 图 10. 9(g) 所 示 ,这样 的 一 棵 树 称 为 快速 排序 递归 树 ,其 中 每 个 分 支 结 点 对 
应 一 次 递归 调用 ,这 里 递归 次 数 为 7 次 。 从 中 可 以 看 出 , 左 、 右 分 区 处 理 的 顺序 是 无 关 的 ,也 
就 是 说 , 当 一 次 划分 产生 两 个 子 区 间 时 先 处 理 左 分 区 还 是 右 分 区 不 影响 排序 的 结果 ,因为 这 
两 个 子 问题 是 独立 的 。 


快速 排序 最 好 的 情况 是 每 一 次 划分 都 将 n 个 元 素 划 分 为 两 个 长 度 差 不 多 相同 的 子 
间 , 也 就 是 说 ,每 次 划分 所 取 的 基准 都 是 当前 无 序 区 的 “中 值 ”元 素 ,划分 的 结果 是 基准 的 左 、 
右 两 个 无 序 子 区间 的 长 度 大 致 相等 ,如 图 10. 10 所 示 , 这 样 的 递归 树 高 度 为 O(logsn) ,而 每 
一 层 划分 的 时 间 为 O(n), 所 以 此 时 算法 的 时 间 复 杂 度 为 O(nlogsn)、 空 间 复 杂 度 为 
O(log2n)。 


al 








| 个 元 素 
| i 分, tn 
k 个 元 素 “| 〇 | nk-1 个 元 素 


图 10.10 快速 排序 的 最 好 情况 
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快速 排序 最 坏 的 情况 是 每 次 划分 选取 的 基准 都 是 当前 无 序 区 中 关键 字 最 小 (或 最 大 ) 的 
元 素 ,划分 的 结果 是 基准 左边 的 子 区 间 为 空 (或 右边 的 子 区 间 为 空 ), 而 划分 所 得 的 另 一 个 非 
空 的 子 区 间 中 元 素 的 数目 仅 比 划分 前 的 无 序 区 中 的 元 素 个 数 减少 一 个 。 这 样 的 递归 树 高 度 
为 n, 需 要 做 n 一 1 次 划分 ,此 时 算法 的 时 间 复 杂 度 为 O(02)、 空 间 复杂 度 为 O(n)。 

在 平均 情况 下 ,每 一 次 划分 将 n 个 元 素 划 分 为 两 个 长 度 分 别 为 一 1 和 nn 一 k 的 子 区 间 ， 
的 取 值 范围 是 1~n, 共 种 情况 ,如 图 10. 11 所 示 。 设 执行 时 间 为 Tue(z) ,显然 有 : 


Ts = mt DT — D+ Ten—k)) 
k=1 
由 上 式 可 以 推出 Tw 二 O(nlogzn) ,其 中 cn 表示 划分 的 时 间 。 








7 个 元 素 


几 一 ER /的 取 值 范围 是 1-mn， 共 nm 种 情况 

















大 1 个 元 素 | () | mk 个 元 素 


图 10.11 快速 排序 的 平均 情况 


由 上 述 分 析 可 知 ,快速 排序 最 好 的 时 间 复 杂 度 为 O(nlogzn)、 最 坏 的 时 间 复 杂 度 为 
OC) ,平均 时 间 复 杂 度 为 O(nlogzn) ,也 就 是 说 ,算法 的 平均 时 间 复 杂 度 接近 最 好 情况 。 

当初 始 数 据 序列 为 正 序 或 者 反 序 时 ,显然 呈现 出 最 坏 的 情况 。 如 果 初 始 数 据 序列 是 随 
机 的 ,每 次 可 以 划分 为 两 个 长 度 差不多 相同 的 子 区 间 ,会 呈现 出 最 好 的 情况 。 

在 快速 排序 算法 中 一 趟 使 用 i、j 和 tmp 这 3 个 辅助 变量 ,为 常量 级 , 若 每 一 趟 排序 都 将 
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元 素 序列 均匀 地 分 割 成 两 个 长 度 接近 的 子 区 间 , 递 归 树 的 高 度 为 O(logsn) ,所 需 栈 空间 为 
O(logzn)。 但 是 在 最 坏 情 况 下 递归 树 的 高 度 为 O(n) 、 所 需 栈 空间 为 O(n) ,平均 情况 下 所 需 
栈 空间 为 O(logsn) ,所 以 快速 排序 的 空间 复杂 度 为 O(logsn)。 

另外 ,快速 排序 算法 是 一 种 不 稳定 的 排序 方法 。 例 如 ,排序 序列 为 {5,2,4,8,7,|4|), 基 
准 为 5, 在 进行 划分 时 后 面 的 |4| 会 放置 到 前 面 2 的 位 置 上 ,从 而 使 其 放 到 4 的 前 面 ,两 个 相 
同 关键 字 (4) 的 相对 位 置 改变 了 。 

实际 上 ,在 快速 排序 中 可 以 以 任意 一 个 元 素 为 基准 (更 好 的 选择 方法 是 从 数 序 中 随机 选 
择 一 个 元 素 作为 基准 ) ,以 下 算法 以 当前 区 间 的 中 间 位 置 的 元 素 为 基准 ,同样 可 以 达到 快速 
排序 的 目的 : 


























void QuickSort1(RecType R[] ,int s,int t) // 对 R[s.. 避 以 中 间 位 置 元 素 为 基准 进行 快速 排序 


{ inti,pivot; 


pivot= (s+t)/2; // 用 区 间 中 间 元 素 作为 基准 
if (s<t) // 区 间 内 至 少 存在 两 个 元 素 的 情况 
{ if (pivot!=s) // 若 基准 不 是 区 间 中 的 第 一 个 元 素 ,将 其 与 第 一 个 元 素 交 换 
swap(R[pivot] ,R[s] ) ; 
i=partition(R, s, t); // 划 分 


QuickSortl(R, s,i—1); // 对 左 区 间 递 归 排 序 
QuickSort1(R,i+1,t); // 对 右 区 间 递 归 排 序 


} 
} 
选择 排序 的 基本 思想 是 每 一 趟 从 待 排序 的 元 素 中 选 出 关键 字 最 小 的 元 素 ,顺序 放 在 已 
排 好 序 的 子 表 的 最 后 ,直到 全 部 元 素 排序 完毕 。 由 于 选择 排序 方法 每 一 趟 总 是 从 无 序 区 中 
选 出 全 局 最 小 (或 最 大 ) 的 关键 字 , 所 以 适合 于 从 大 量 的 元 素 中 选择 一 部 分 排序 元 素 , 例 如 从 
10 000 个 元 素 中 选择 出 关键 字 大 小 为 前 10 位 的 元 素 就 适合 于 采用 选择 排序 方法 。 
本 节 介绍 两 种 选择 排序 方法 , 即 简单 选择 排序 (或 称 直接 选择 排序 ) 和 堆 排 序 。 


1041 简单 选择 排序 


简单 选择 排序 (simple selection sort) 的 基本 思想 是 第 i 趟 排序 开始 时 ,当前 有 序 区 和 无 
序 区 分 别 为 RL0..i 一 1] 和 [i..n 一 1](0 志 i 过 n 一 1) ,该 趟 排序 是 从 当前 无 序 区 中 选 出 关键 
字 最 小 的 元 素 RLA] ,将 它 与 无 序 区 的 第 1 个 元 素 R[ 门 交换 ,使 RL0.. 门 和 民 扫 - 扫 
[i 十 1..n 一 1] 分 别 变 为 新 的 有 序 区 和 新 的 无 序 区 ,如 图 10. 12 所 示 。 

因为 每 趋 排序 均 使 有 序 区 中 增加 了 一 个 元 素 , 且 有 序 区 中 元 素 的 关键 
字 均 不 大 于 无 序 区 中 元 素 的 关键 字 , 即 第 i 趟 排序 之 后 RL0.. 门 的 所 有 关键 
字 均 小 于 等 于 RLi 十 1..n 一 1 中 的 所 有 关键 字 , 所 以 进行 一 1 趟 排序 之 后 视频 讲解 
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R[0..n 一 2] 的 所 有 关键 字 小 于 等 于 R[n 一 1]. key, 也 
































a 有 序 区 无 序 区 
就 是 说 ,经 过 ”一 1 趟 排序 之 后 整个 表 RL0..n 一 1] 递 增 [一 RL]| [REA RLM] RD 
说 明 : 简单 选择 排序 每 趋 产 生 的 有 序 区 一 定 是 全 “全 和 || 将 从 无 序 区 中 拢 选 的 
局 有 序 区 ,也 就 是 说 ,每 赵 产 生 的 有 序 区 中 所 有 元 素 都 最 小 记录 放 在 AI 
看 栓 子 [ato] .. RE REA] [RL RD 
和 有 序 区 无 序 区 


那么 如 何 从 无 序 区 RC. 一] 中选 出 关键 字 最 小 | 
的 元 素 R[4] 呢 ? 简单 选择 排序 就 是 采用 最 简单 的 两 两 。 图 10 12 直接 选择 排序 的 一 得 


元 素 比较 的 方法 实现 的 ,其 过 程 如 下 。 排序 过 程 
k=i; /人 kk 存放 R[i..n 一 1] 中 最 小 关键 字 的 下 标 , 初 值 为 i 
for (j=i 二 1;j<n;j 二 十) // 扫 描 无 序 区 中 的 所 有 元 素 
if (RD]. key< R[k]. key) // 将 较 小 的 元 素 下 标 存放 到 k 中 
jy 


显然 ,R[i..n 一 1] 中 共有 n 一 i 个 元 素 , 上 述 过 程 需要 n 一 i 一 1 次 关键 字 比 较 。 然 后 将 
R[k] 与 RCI 交换 ,将 R[kJ 放 在 无 序 区 R[i..n 一 1] 的 最 前 面 ,从 而 实现 了 一 趟 排序 。 这 种 采 
用 简单 比较 方法 选 出 关键 字 最 小 的 元 素 就 是 简单 选择 排序 名 称 的 由 来 。 


2 排序 算法 


简单 选择 排序 的 算法 如 下 : 
void SelectSort(RecType RD ,int n) 
{ intij,k; 
for (i=0;i<n—1;i+ 十 ) // 做 第 i 趟 排序 
{ k=i; 
for (j=i+1;j<n;j+t 二 ) // 在 当前 无 序 区 R[i..n 一 切中 选 key 最 小 的 R[k] 
if (RD] .key<R[k].key) 
kj //k 记 下 目前 找到 的 最 小 关键 字 所 在 的 位 置 
if (k!=D) //R[] 和 R[k] 两 个 元 素 交换 


swap(R[], ROk]); 
} 
} 


【 例 10.5】 设 待 排 序 的 表 有 10 个 元 素 , 其 关键 字 分 别 为 (6,8,7,9,0,1,3,2,4,5), 说 
明 采 用 简单 选择 排序 方法 进行 排序 的 过 程 。 

其 排序 过 程 如 图 10. 13 所 示 ,每 直选 择 出 一 个 元 素 (图 中 用 带 阴影 的 部 分 表示 当前 
的 有 序 区 ) 。 





一 


显然 ,无 论 初始 数据 序列 的 状态 如 何 , 在 第 i 趋 排 序 中 选 出 最 小 关键 字 的 元 素 , 内 for 循 
环 需 做 一 1 一 (i 十 1) 十 1 二 n 一 i 一 1 次 比较 ,因此 总 的 比较 次 数 为 ; 
Cn = 7) 2 一 ;一 1 一 一 Oo2) 


i=0 


至 于 元 素 的 移动 次 数 , 当 初始 表 为 正 序 时 ,移动 次 数 为 0; 当 表 初 态 为 反 序 时 ,每 趟 排序 
均 要 执行 交换 操作 ,所 以 总 的 移动 次 数 为 最 大 值 3(n 一 1)。 然 而 ,无 论 元 素 的 初始 序列 如 何 
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图 10.13 直接 选择 排序 的 过 程 


排列 ,所 需 进行 的 关键 字 比 较 相 同 ,因此 总 的 平均 时 间 复 杂 度 为 O(n?)。 
在 简单 选择 排序 算法 中 只 使 用 i\j、k 和 tmp 这 4 个 辅助 变量 ,与 问题 规模 无 关 , 故 辅 
助 空间 复杂 度 为 0(1) ,也 就 是 说 它 是 一 个 就 地 排序 。 


另外 ,简单 选择 排序 算法 是 一 个 不 稳定 的 排序 方法 。 例 如 排序 序列 为 {5,3,2,|5],4,1， 
7} ,第 1 趟 排序 时 选择 出 最 小 关键 字 1 ,将 其 与 第 1 个 位 置 上 的 元 素 交换 ,得 到 {1,3,2,5， 
4,|5|,8,7} ,从 中 看 到 两 个 5 的 相对 位 置 发 生 了 改变 。 


1042 堆 排 序 


堆 排序 (heap sort) 是 一 种 树 形 选择 排序 方法 , 它 的 特点 是 将 R[1..n](R[ 门 的 关键 字 为 
k;) 看 成 是 一 棵 完全 二 又 树 的 顺序 存储 结构 ,如 图 10. 14 所 示 。 利 用 完全 二 叉 树 中 双亲 结 点 
和 孩子 结 点 之 间 的 位 置 关系 在 无 序 区 中 选择 关键 字 最 大 (或 最 小 ) 的 元 素 。 


CD 
br … CE 
Ca) 人 


图 10. 14 ”将 关键 字 序列 看 成 一 棵 完全 二 叉 树 
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堆 的 定义 是 RO1..n] 中 的 个 关键 字 序列 ki ,ks,… ,ks 称 为 堆 , 当 且 仅 当 该 序列 满足 如 
下 性 质 (简称 为 堆 性 质 ): 


@0@, 内 排 序 





(1) kh 有 kiShkt 或 (2) kk bik (lSi<|n/2 |) 
满足 第 (1) 种 情况 的 堆 称 为 小 根 堆 ( 对 于 图 10. 14, 就 
是 树 中 分 支 任何 结 点 的 关键 字 都 小 于 其 孩子 结 点 的 关键 
字 ) ,满足 第 (2) 种 情况 的 堆 称 为 大 根 堆 ( 对 于 图 10. 14 ,就 二 
是 树 中 任何 分 支 结 点 的 关键 字 都 大 于 等 于 其 孩子 结 点 的 we | 


无 序 区 有 序 区 
RU … am j[RIr + RI] 





























关键 字 ) 。 下 面 主要 讨论 大 根 堆 。 人 
堆 排序 的 排序 过 程 与 简单 选择 排序 类 似 , 只 是 挑选 最 多 一 AR 到 
大 或 最 小 元 素 时 采用 的 方法 不 同 ,这 里 采用 大 根 堆 ,每 次 


挑选 最 大 元 素 归 位 ,排序 过 程 如 图 10. 15 所 示 。 挑 选 最 大 图 10.15 堆 排序 的 一 趟 排序 过 程 
元 素 是 采用 筛选 方法 实现 的 。 

说 明 : 堆 排序 每 赵 产 生 的 有 序 区 一 定 是 全 局 有 序 区 ,也 就 是 说 每 赵 产 生 的 有 序 区 中 的 
所 有 元 素 都 归 位 了 。 


推 排序 的 关键 是 筛选 ,其 过 程 是 假如 完全 二 叉 树 的 根 结 点 是 R[ 门 , 它 的 左 、 右 子 树 已 是 
大 根 堆 ,将 其 两 个 孩子 的 关键 字 RL2 门 . key、RL2i 十 1]. key 的 最 大 者 与 R[ 让 . key 比较 , 若 尺 
[ 门 . key 较 小 ,将 其 与 最 大 孩子 进行 交换 ,这 有 可 能 破坏 下 一 级 的 堆 。 继 续 采 用 上 述 方法 构 
造 下 一 级 的 堆 , 直 到 这 棵 完全 二 叉 树 变 成 一 个 大 根 堆 为 止 。 

假设 对 RLlow..highj] 进 行 筛选 ,必须 满足 如 图 10. 16 所 示 的 前 提 条 件 , 即 以 RLlowj 为 
根 结 点 的 左 子 树 和 右 子 树 均 为 大 根 堆 , 其 筛选 算法 sift() 如 下 : 





void sift(RecType R[] ,int low, int high) 
{ inti=low,j=2*i; //R 加 是 R 吕 的 左 孩 子 
RecType tmp 王 RDD ; 
while (j < 一 high) 
{过 G<high && RD 站 .key<RD 十 本 .key) // 若 右 孩 子 较 大 ,把 j 指向 右 孩子 


bs 
if (tmp. key < RD]. key) // 若 根 结 点 小 于 最 大 孩子 的 关键 字 
{ R=RO; // 将 RR 四 调整 到 双亲 结 点 位 置 上 
hd // 修 改 i 和 j 值 ,以 便 继续 向 下 筛选 
j=22 
} 
else break; // 若 根 结 点 大 于 等 于 最 大 孩子 关键 字 ,筛选 结束 
} 
R[]=tmp; // 被 筛选 结 点 放 人 最 终 位 置 上 


} 





构建 初始 堆 RL1..n] 的 过 程 是 : 对 于 一 棵 完全 二 叉 树 ,从 i 一 |Lz/2 一 1, 即 从 最 后 一 个 


分 支 结 点 开始 ,反复 利用 上 述 筛选 方法 建 堆 。 大 者 * 上 浮 ”, 小 者 被 “筛选 ”下 去 。 即 : aa 
for (i=n/2;i>=1;i——) 
sift(R,i,n); 


在 初始 堆 RL1.. 轨 构造 好 以 后 , 根 结 点 RLI] 一 定 是 最 大 关键 字 结 点 ,将 其 放 到 排序 序列 
的 最 后 ,也 就 是 将 堆 中 的 根 与 最 后 一 个 叶子 交换 。 由 于 最 大 元 素 已 归 位 ,整个 待 排序 的 元 素 
个 数 减少 一 个 。 由 于 根 结 点 的 改变 ,这 ”一 1 个 结 点 R[1..n 一 1] 不 一 定 为 堆 , 但 其 左 子 树 和 
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图 10.16 ”筛选 算法 建 堆 的 前 提 条 件 


右 子 树 均 为 堆 , 再 调用 一 次 sift 算法 将 这 一 1 个 结 点 R[1..n 一 1] 调 整 成 堆 , 其 根 结 点 为 次 
大 的 元 素 ,将 它 放 到 排序 序列 的 倒数 第 2 个 位 置 ,即将 堆 中 的 根 与 最 后 一 个 叶子 交换 , 待 排 
序 的 元 素 个 数 变 为 n 一 2 个 , 即 R[1..n 一 2], 再 调整 ,再 将 根 结 点 归 位 ,如 此 这 样 ,直到 完全 
二 又 树 只 剩 一 个 根 为 止 。 实 现 堆 排序 的 算法 如 下 : 


void HeapSort(RecType RD ,int n) 
《intit 


for (i=n/2;i>=1;i——) // 循 环 建立 初始 堆 ,调用 sift 算法 | n/2 | 次 
sift(R,i,n); 
for (i=n;i>=2;i——) // 进 行 n 一 1 趟 完成 堆 排序 ,每 一 赵 堆 中 元 素 个 数 减 1 
{ swap(R[LI] ,RDD); // 将 最 后 一 个 元 素 与 根 R[1] 交 换 
sift(R,1,i—1); // 对 ROD1..i 一 切 进 行 第 选 ,得 到 i 一 1 个 结 点 的 堆 


} 
} 


【 例 10.6】 设 待 排 序 的 表 有 10 个 元 素 , 其 关键 字 分 别 为 (6,8,7,9,0,1,3,2,4,5), 说 
明 采 用 堆 排 序 方法 进行 排序 的 过 程 。 

其 初始 状态 如 图 10. 17(a) 所 示 ,依次 从 结 点 0.9、7、8、6 调用 sift 算法 ,构建 的 初始 
堆 如 图 10.17(b) 所 示 。 堆 排序 过 程 如 图 10. 18 所 示 , 每 归 位 一 个 元 素 (将 其 交换 到 有 序 区 
开头 ) ,就 对 堆 进 行 一 次 筛选 调整 。 


(9) @ 
( 一 So 
(2 (OY 已) (1 YY © 
©) YO) GO 
(a) 初始 状态 (b) 建立 的 初始 堆 为 : 
12345678910 
Blslzlslsl js 


图 10.17 建立 初始 堆 
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(6) 7 人 2。 第 3 趟 结果 : op 
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[ze slslsh lorlsTel 
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0 12345678910 
























































1234567891 
[ols[314l2[' Tel7 sl] 四 四 目 加 日 回回 四 日 加 
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23 12345678910 
1]2131oalsTel slsl oj2T sslsTel7Tsls] 
(0) 2 人 21. 第 8 趟 结 (p) 往 选 调整 (q) 1%0. 第 9 趟 结 (D 得 到 最 终 
12345678910 12345678910 排序 结果 
1[of21314lsTel7 [sle of1[21314[sTel7[sT9] 
































10.18” 堆 排序 过 程 
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堆 排 序 的 时 间 主 要 由 建立 初始 堆 和 反复 重建 堆 这 两 部 分 的 时 间 构 成 ,它们 均 是 通过 调 
用 siftO 〇 实现 的 。 

对 于 高 度 为 & 的 完全 二 叉 树 / 子 树 , 调 用 sift() 算 法 时 ,其 中 while 循环 最 多 执行 人 一 1 
次 ,所 以 最 多 进行 2(k 一 1) 次 关键 字 比 较 , 最 多 进行 十 1 次 元 素 移 动 ,因此 主要 以 关键 字 比 
较 来 分 析 时 间 性 能 。 

nn 个 结 点 的 完全 二 叉 树 的 高 度 h = logsn 十 1。 在 建立 初始 堆 时 ,需要 筛选 调整 的 层 为 
h 一 1~1 层 , 以 第 i 层 中 某 个 结 点 为 根 的 子 树 的 高 度 为 h 一 i 十 1, 并 且 第 i 层 中 最 多 有 2 一 个 
结 点 。 设 建立 初始 堆 所 需要 的 关键 字 比 较 次 数 最 多 为 C1 (n) ,有 : 

Cn = 3 2 X2 一 ;十 1 一 1 = > 2 x (h—i) 


i=h-l i=h—1 


令 j=h 一 i, 当 i=h 一 1 时 ,j=1; 当 i=1 时 ,j=h 一 1, 所 以 :; 
h—l 

Gm = WX R= 
j=l 


i=h—l 














一 2 X12 X22 XX hl1 
= 2 — 2h—2 < 2 + 4X 2 = dn 
因此 ,建立 初始 堆 总 共 进 行 的 关键 字 比 较 次 数 不 超 过 4n。 类 似 地 , 设 重建 堆 中 对 sift() 
的 n 一 1 次 调用 所 需 的 比较 总 次 数 C,(n)。 其 中 i 从 nn 到 2, 每 次 对 R[1..i 一 1] 的 i 一 1 个 结 
点 的 完全 二 又 树 进 行 筛选 调整 ,该 树 的 高 度 为 logs (i 一 1) 十 1, 所 以 有 : 


Gn = D2x og i—1 十 1 一 1) = ?2 log: i—1 < 2nlogn 


这 样 ， 堆 排序 所 需 的 关键 字 比 较 的 总 次 数 最 多 为 C100) C2 Cn) —4n 2nlogsn— O(nlogsn) 。 

综 上 所 述 , 堆 排序 的 最 坏 时 间 复 杂 度 为 O(nlogsn)。 堆 排序 的 平均 性 能 分 析 较 难 , 但 实 
验 研究 表明 , 它 较 接近 最 坏 性 能 。 实 际 上 , 堆 排 序 和 简单 选择 排序 算法 一 样 ,其 时 间 性 能 与 初 
始 序 列 的 顺序 无 关 , 也 就 是 说 , 堆 排 序 算法 的 最 好 、 最 坏 和 平均 时 间 复 杂 度 都 是 O(nlogzn) 。 

由 于 建 初始 堆 所 需 的 比较 次 数 较 多 ,所 以 堆 排 序 不 适合 元 素数 较 少 的 排序 表 。 

堆 排 序 只 使 用 i\j 、tmp 等 辅助 变量 ,其 辅助 空间 复杂 度 为 0(1)。 

另外 ,在 进行 筛选 时 可 能 把 后 面相 同 关 键 字 的 元 素 调整 到 前 面 , 所 以 堆 排 序 算法 是 一 种 
不 稳定 的 排序 方法 。 


1“ 排 子 志 路 


归并 排序 (merge sort) 是 多 次 将 两 个 或 两 个 以 上 的 有 序 表 合 并 成 一 个 新 的 有 序 表 。 最 
简单 的 归并 是 直接 将 两 个 有 序 的 子 表 合 并 成 一 个 有 序 的 表 , 即 二 路 归并 。 

二 路 归并 排序 (2-way merge sort) 的 基本 思路 是 将 RL0..n 一 1] 看 成 是 个 长 度 为 
1 的 有 序 序列 ,然后 进行 两 两 归并 .得 到 | z/2 | 个 长 度 为 2( 最 后 一 个 有 序 序列 的 长 度 可 能 


EE 
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为 2) 的 有 序 序 列 , 再 进行 两 两 归并 ,得 到 [n/4 |] 个 长 度 为 4( 最 后 一 个 有 序 
序列 的 长 度 可 能 小 于 4) 的 有 序 序列 ,…, 直 到 得 到 一 个 长 度 为 n 的 有 序 
序列 。 

说 明 : 归并 排序 每 趟 产生 的 有 了 序 区 只 是 局 部 有 序 的 ,也 就 是 说 在 最 后 
一 趟 排序 结束 前 所 有 元 素 并 不 一 定 归 位 了 。 


先 介绍 将 两 个 有 序 表 直 接 归并 为 一 个 有 序 表 的 算法 Merge() 。 设 两 个 有 序 表 存 放 在 同 
一 数组 中 相 邻 的 位 置 上 , 即 RElow..mid],R[mid 十 1..high], 先 将 它们 合并 到 一 个 局 部 的 暂 
存 数组 R1 中 , 待 合并 完成 后 将 R1 复制 到 RR 中 。 

为 了 简便 , 称 RLlow..mid] 为 第 1 段 ,RLmid 十 1..high] 为 第 2 段 。 每 次 从 两 个 段 中 取出 
一 个 元 素 进行 关键 字 的 比较 ,将 较 小 者 放 入 R1 中 ,最 后 将 各 段 中 余下 的 部 分 直接 复制 到 
Rl1 中 。 这 样 R1 是 一 个 有 序 表 , 再 将 其 复制 到 R 中 。 对 应 的 算法 如 下 : 




















void Merge(RecType R[] ,int low, int mid, int high) 归并 R[low..high] 
{ RecType * R1; 











int i 一 low,j 一 mid 十 1,k 一 0; //k 是 Rl 的 下 标 ,ij 分 别 为 第 1.2 段 的 下 标 
R1= (RecType * )malloc((high 一 low 十 1) * sizeof(RecType) ) ; // 动 态 分 配 空间 
while (i<=mid && j<=high) // 在 第 1 段 和 第 2 段 均 未 扫描 完 时 循环 
if (R[]. key <=RD].key) // 将 第 1 段 中 的 元 素 放 入 R1 中 
{ RI[k]=RO]; 
es kt 
} 
else // 将 第 2 段 中 的 元 素 放 入 R1 中 
{ RI[k=RD]; 
FEE 
} 
while (i<=mid) // 将 第 1 段 余下 的 部 分 复制 到 R1 
{ Rllk]=R[O]; 
计生 二 于 十 ; 
} 
while (j < 一 high) // 将 第 2 段 余下 的 部 分 复制 到 R1 
{ Rilk]=R0]; 
jt 
} 
for (k=0,i=low;i<=high;k 十 十 ,i 二 十 ) // 将 R1 复制 到 R[low..high] 中 
R[]=R1[k]; 
free(R1); | 


下 


Merge() 实 现 了 一 次 归并 ,其 中 使 用 的 辅助 空间 正好 是 要 归并 的 元 素 个 数 。 接 下 来 需 
利用 Merge() 解 决 一 趟 归并 问题 。 在 某 趟 归并 中 , 设 各 子 表 的 长 度 为 length( 最 后 一 个 子 表 


的 长 度 可 能 小 于 length) , 则 归并 前 R[0..n 一 1] 中 共 | 二 | 个 有 序 的 子 表 : 
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n 
R[0..length— 1],R[length..2length—1],*…,R | | X length..n—1 


在 调用 Merge() 将 相 邻 的 一 对 子 表 进 行 归并 时 ,必须 对 表 的 个 数 可 能 是 奇数 以 及 最 后 
一 个 子 表 的 长 度 小 于 length 这 两 种 特殊 情况 进行 特殊 处 理 : 若 子 表 的 个 数 为 奇数 , 则 最 后 
一 个 子 表 无 须 和 其 他 子 表 归 并 ( 即 本 趟 轮空 ); 若 子 表 的 个 数 为 偶数 , 则 要 注意 到 最 后 一 对 
子 表 中 后 一 个 子 表 的 区 间 上 界 是 "一 1。 一 趟 归并 的 算法 如 下 : 





void MergePass(RecType RD ,int length, int n) // 对 整个 排序 序列 进行 一 趟 归并 
AR 和 
for (i=0;i 十 2x length 一 1<nii 一 i 十 2* length)  // 归 并 length 长 的 两 相 邻 子 表 
Merge(R,i,i 十 length 一 1,i 十 2 * length 一 1); 
if (i 十 length 一 1<n 一 1) // 余 下 两 个 子 表 , 后 者 的 长 度 小 于 length 
Merge(R,i,i 十 length 一 1,n 一 1); // 归 并 这 两 个 子 表 
} 


在 进行 二 路 归并 排序 时 ,第 1 趟 归并 排序 对 应 length 二 1, 第 2 趟 归并 排序 对 应 length 一 
2,…, 依 此 类 推 ,每 一 次 length 增 大 两 倍 , 但 length 总 是 小 于 ,所 以 总 趟 数 为 [logsn | 。 对 
应 的 二 路 归并 排序 算法 如 下 : 








void MergeSort(RecType RD] ,int n) // 二 路 归并 排序 
{ int length; 
for (length=1;length<n;length=2 x length) // 进 行 | log:z | 赵 归 并 


MergePass(R,length,n); 








这 -到 
视频 讲解 

上 述 二 路 归并 排序 实际 上 采用 的 是 自 底 向 上 的 过 程 , 也 可 以 采用 自 顶 向 下 的 递归 过 程 ， 
其 算法 如 下 ,这 里 不 再 详细 介绍 。 


} 





void MergeSortDC(RecType R[] ,int low,int high) ”// 对 R[low..highj 进 行 二 路 归并 排序 
{ int mid; 
if (low< high) 
{ mid= (low+high)/2; 
MergeSortDC(R, low, mid); 
MergeSortDC(R, mid+ 1, high) ; 
Merge(R, low, mid, high) ; 
} 
} 
void MergeSortl (RecType RD] ,int n) // 自 项 向 下 的 二 路 归并 算法 
{ 
MergeSortDC(R,0,n—1); 
} 


【 例 10.7】 设 待 排序 的 表 有 10 个 元 素 ,其 关键 字 分 别 为 (6,8,7,9,0,1,3,2,4,5), 说 
明 采 用 二 路 归并 排序 方法 进行 排序 的 过 程 。 

在 采用 二 路 归并 排序 时 需要 进行 [logzn |=4 趟 归并 排序 ,其 排序 过 程 如 图 10. 19 
所 示 , 称 之 为 归并 树 ,其 高 度 为 5。 
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图 10.19 二 路 归并 排序 过 程 


对 于 长 度 为 n 的 排序 表 , 二 路 归并 需要 进行 [logzn | 趟 ,每 趟 归并 时 间 为 O(n), 故 其 时 
间 复 杂 度 无 论 是 在 最 好 还 是 在 最 坏 情况 下 均 是 O(nlogsn), 显 然 平 均 时 间 复 杂 度 也 是 
O(nlog2n)。 

在 二 路 归并 排序 过 程 中 ,每 次 二 路 归并 都 需要 使 用 一 个 辅助 数组 来 暂 存 两 个 有 序 子 表 
归并 的 结果 ,而 每 次 二 路 归并 后 都 会 释放 其 空间 ,但 最 后 一 趟 需要 所 有 元 素 参与 归并 ,所 以 
总 的 辅助 空间 复杂 度 为 OCz) 。 

在 一 次 二 路 归并 中 ,如果 第 1 段 元 素 RCI 和 第 2 段 元 素 RLj] 的 关键 字 相 同 ,总 是 将 
R[ 疏 放 在 前 面 \.R[j] 放 在 后 面 ,相对 次 序 不 会 发 生 改变 ,所 以 二 路 并 归并 排序 是 一 种 稳定 的 
排序 算法 。 

归并 排序 可 以 是 多 路 的 ,如 三 路 归并 排序 等 。 以 三 路 归并 排序 为 例 , 归 并 的 趟 数 是 
[logsn |], 每 一 趟 的 时 间 为 O(n) ,对 应 的 执行 时 间 为 O(nlogsn) ,但 logsz 一 logzy/log:3， 
所 以 时 间 复 杂 度 仍 为 O(nlogzn) ,不 过 三 路 归并 排序 算法 的 实现 远 比 二 路 归并 排序 算 
法 复杂 。 


基数 排序 米 


排序 二 和 

前 面 所 讨论 的 排序 算法 均 是 基于 关键 字 之 间 的 比较 来 实现 的 ,而 基数 排序 (radix sort) 
是 通过 “分 配 ” 和 “收集 ”过 程 来 实现 排序 ,不 需要 进行 关键 字 间 的 比较 ,是 一 种 借助 于 多 关键 
字 排 序 的 思想 对 单 关键 字 排 序 的 方法 。 

一 般 情况 下 ,元 素 R[ 门 的 关键 字 R[ 门 . key 由 d 位 数字 (或 字符 ) 组 成 , 即 名 -1Ae -2 … 
kik" ,每 一 个 数字 表示 关键 字 的 一 位 ,其 中 k"! 为 最 高 位 .k" 是 最 低位 ,每 一 位 的 值 都 在 0 三 
kr 范围 内 ,其 中 7 称 为 基数 (radix)。 例 如 ,对 于 二 进 制 数 7 为 2, 对 于 十 进 制 数 7 为 10。 
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基数 排序 有 两 种 , 即 最 低位 优先 (least significant digit first,LSD) 和 最 高 位 优先 (most 
significant digit first, MSD) ,其 原理 是 相同 的 .后 面 主要 讨论 前 者 。 

最 低位 优先 的 过 程 是 先 按 最 低位 的 值 对 元 素 进行 排序 ,在 此 基础 上 再 按 次 低位 进行 排 
序 , 依 此 类 推 。 由 低位 向 高 位 ,每 趟 都 是 根据 关键 字 的 一 位 并 在 前 一 趟 的 基础 上 对 所 有 元 素 
进行 排序 ,直至 最 高 位 , 则 完成 了 基数 排序 的 整个 过 程 。 

在 对 一 个 数据 序列 排序 时 是 采用 最 低位 优先 还 是 最 高 位 优先 排序 方法 是 由 数据 序列 的 
特点 确定 的 。 例 如 对 整数 序列 递增 排序 ,由 于 个 位 数 的 重要 性 低 于 十 位 数 ,十 位 数 的 重要 性 
低 于 百 位 数 ,一 般 越 重要 的 位 越 放 在 后 面 排序 ,个 位 数 属于 最 低位 ,所 以 对 整数 序列 递增 排 
序 时 应 该 采用 最 低位 优先 排序 方法 。 

以 7 为 基数 的 最 低位 优先 排序 的 过 程 是 假设 线性 表 由 元 素 序列 ao,al,…,a,-1 构 成 ,每 
个 元 素 w 的 关键 字 为 d 元 组 : 

有 
其 中 0 外 r 一 1(0<<j 过 n,0<i<d 一 1)。 在 排序 过 程 中 使 用 7 个 队列 Qo ,Qi ，…,Q-1。 
排序 过 程 如 下 : 

对 i 二 0,1,…,d 一 1, 依 次 做 一 次 “分 配 ” 和 “收集 ”( 其 实 就 是 一 次 稳定 的 排序 过 程 )。 

分 配 : 开始 时 ,把 Qu,Q,…,Q.-: 各 个 队列 置 成 空 队列 ,然后 依次 考查 线性 表 中 的 每 一 
个 元 素 aj GO=0,1,…, 一 1) ,如 果 元 素 w 的 关键 字 k; 二 k, 就 把 元 素 w 插入 到 Q 队列 中 。 

收集 : 将 Q, ,Qi，,…,Q,-1 各 个 队列 中 的 元 素 依次 首尾 相 接 , 得 到 新 的 元 素 序列 ,从 而 组 
成 新 的 线性 表 。 

在 d 趟 执行 后 数据 序列 就 有 序 了 。 

说 明 : 基数 排序 每 赵 并 不 产生 有 序 区 ,也 就 是 说 在 最 后 一 趟 排序 结 束 前 所 有 元 素 并 不 
一 定 归 位 了 。 


在 基数 排序 中 每 个 元 素 多 次 进出 队列 ,如 果 采 用 顺序 表 存储 ,需要 有 大 量 元 素 的 移动 ， 
而 采用 链 式 存储 结构 时 ,只 需要 修改 相关 指针 域 。 所 以 这 里 将 排序 序列 采用 链 式 存储 结构 
存储 。 

假设 待 排序 的 数据 序列 存放 在 以 p 为 首 结 点 指针 的 单 链 表 中 ,其 中 结 点 类 型 
NodeType 的 声明 如 下 : 





typedef struct node 











{ char dataLMAXD] ; //MAXD 为 最 大 的 关键 字 位 数 
struct node * next; // 指 向 下 一 个 结 点 
} NodeType; // 基 数 排序 数据 的 结 点 类 型 
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其 中 ,data 域 存放 关键 字 , 它 是 一 个 字符 数组 ,data[0..MAXD-1] 依 次 存放 关键 字 的 低位 到 
高 位 的 各 数字 字符 ,关键 字 的 实际 位 数 由 参数 4 指定 。 

以 下 基数 排序 算法 radix_sord(p,r,d) 实 现 LSD 方法 ,其 中 参数 p 为 存储 的 待 排 序 序 
列 的 单 链表 的 指针 ,r 为 基数 ,d 为 关键 字 位 数 。 
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void RadixSort(NodeType * &p,int r,int d) //LSD 基数 排序 算法 
{ ”NodeType * head[MAXR], x tail[MAXR], x t; // 定 义 各 链 队 的 首尾 指针 
int i,j, k; 
for (i=0;i<=d 一 1;i+ 十 ) // 从 低位 到 高 位 循环 
{ for (=0;j<r;j+ 二 ) // 初 始 化 各 链 队 的 首 、 尾 指针 
head[D] =tailD] =NULL; 
while (p!=NULL) // 分 配 : 对 于 原 链表 中 的 每 个 结 点 循环 
{ k=p—>data[i]—'0'; // 找 第 k 个 链 队 
if (head[k] == NULL) // 第 kk 个 链 队 空 时 , 队 头 、 队 尾 均 指 向 结 点 p 
{ head[k]=p;tail[k]=p;} 
else // 第 k 个 链 队 非 空 时 结 点 p 进 队 
{ tailfk]—> next=p;tail[k]=p; } 
p=p —> next; // 取 下 一 个 待 排序 的 元 素 
} 
p=NULL; // 重 新 用 p 来 收集 所 有 结 点 
for (j=0j<rj tt // 收 集 : 对 于 每 一 个 链 队 循环 
if (head0] !=NULL) // 若 第 j 个 链 队 是 第 一 个 非 空 链 队 


{ if(p==NULL) 
{ p=headD];t=tail0];} 
else // 车 第 j 个 链 队 是 其 他 非 空 链 队 
{ tt-—>next=head0] ;t=tail0]; } 
} 
t—> next=NULL; // 最 后 一 个 结 点 的 next 域 置 NULL 


} 


【 例 10.8】 设 待 排序 的 表 有 10 个 元 素 , 其 关键 字 分 别 为 (75,23,98,44,57,12,29,64， 
38,82) ,说 明 采 用 基数 排序 方法 进行 排序 的 过 程 。 

国 这 里 x=10.4=2,r==10, 先 按 个 位 数 进行 排序 ,再 按 十 位 数 进行 排序 ,排序 过 程 如 
图 10. 20 所 示 。 

在 基数 排序 过 程 中 为 什么 不 需要 关键 字 比 较 就 能 够 判断 关键 字 的 大 小 呢 ? 实际 上 是 从 
两 个 方面 来 确定 关键 字 的 大 小 的 ,一 是 选择 最 低位 优先 还 是 最 高 位 优先 ,这 样 就 确定 了 关键 
字 各 位 的 重要 性 ; 另外 ,在 对 每 一 位 排序 中 收集 时 是 按 Qu ,Qi ,…,Q,.-: 的 顺序 进行 的 ,这 就 
说 明 有 0 一 1 一 …<(r 一 1) 的 大 小 关系 。 


和 关 放 入 





在 基数 排序 过 程 中 共 进 行 了 qd 趟 的 分 配 和 收集 。 每 一 趟 中 分 配 过 程 需要 扫描 所 有 结 al 


点 ,而 收集 过 程 是 按 队 列 进行 的 ,所 以 一 趟 的 执行 时 间 为 O(n 十 r) ,因此 基数 排序 的 时 间 复 
杂 度 为 O(d(n 十 7))。 

在 基数 排序 中 第 一 趟 排序 需要 的 辅助 存储 空间 为 (创建 上 个 队列 ) ,但 以 后 的 各 趟 排 
序 中 重复 使 用 这 些 队 列 ,所 以 总 的 辅助 空间 复杂 度 为 O(r~) 。 

另外 ,在 基数 排序 中 使 用 的 是 队列 , 排 在 后 面 的 元 素 只 能 排 在 前 面相 同 关 键 字 元 素 的 后 
面 ,相对 位 置 不 会 发 生 改变 , 它 是 一 种 稳定 的 排序 方法 。 
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(e) 按 十 位 收集 之 后 
图 10. 20 ”基数 排序 过 程 





各 种 内 排序 方法 的 比较 和 


本 章 介绍 了 多 种 内 排序 方法 ,将 这 些 排序 方法 总 结 为 如 表 10. 1 所 示 。 通 常 可 按 平均 时 
间 将 排序 方法 分 为 下 面 3 类 。 


(1) 平方 阶 OQ) 排序: 一般 称 为 简单 排序 方法 ,例如 直接 插入 排序 、 简 单 选择 排序 和 


选择 兴 
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冒 泡 排序 。 
(2) 线性 对 数 阶 O(nlogzn) 排 序 ; 如 快速 排序 、 堆 排序 和 归并 排序 。 
(3) 线性 阶 O(n) 排 序 : 如 基数 排序 (假定 数据 的 位 数 d 和 进 制 ~ 为 常量 时 ) 。 


表 10.1 各 种 排序 方法 的 性 能 





























时 间 复 杂 度 空间 
排序 方法 稳定 性 复杂 性 
平均 情况 最 坏 情况 最 好 情况 复杂 度 
直接 插入 排序 ”| Ox?) On’) O(n) OGD) 稳定 简单 
折 半 插入 排序 “| OCz2) OC2) O(n) OGD) 稳定 简单 
希 尔 排序 Ot) OGD) 不 稳定 较 复 杂 
冒 泡 排序 Oe) On) O(n) OGD) 稳定 简单 
快速 排序 OGzlogzm) OCz) Olnlogzn) O(logzn) | 不 稳定 较 复杂 
简单 选择 排序 | OC2) Or) On) OD 不 稳定 简单 
堆 排 序 O(nlogsn) O(nlogzn) O(nlog:n) O(C) 不 稳定 较 复杂 
二 路 归并 排序 O(nlog:n) O(nlogsn) O(nlog2n) Om 稳定 较 复 杂 
基数 排序 Oldlnt+r)) | Oldlnt+n) | Oldn+n)) | O00) 稳定 较 复 杂 


在 内 排序 算法 中 ,一 类 是 稳定 的 , 另 一 类 是 不 稳定 的 。 下 面 通过 一 个 示 
例 说 明 在 什么 情况 下 需要 考虑 算法 的 稳定 性 。 

【 例 10.9】 设 线性 表 中 每 个 元 素 有 两 个 数据 项 kh 和 心 , 现 对 线性 表 按 
以 下 规则 进行 排序 : 先 看 数据 项 k ,ki 值 小 的 在 前 ,大 的 在 后 ; 在 值 相同 
的 情况 下 再 看 k, ,ks 值 小 的 在 前 ,大 的 在 后 。 满 足 这 种 要 求 的 排序 方法 是 : 

(1) 先 按 所 值 进行 直接 插入 排序 ,再 按 &s 值 进行 简单 选择 排序 。 

(2) 先 按 名 值 进 行 直接 插入 排序 ,再 按 &, 值 进行 简单 选择 排序 。 

(3) 先 按 & 值 进行 简单 选择 排序 ,再 按 ks 值 进行 直接 插入 排序 。 

(4) 先 按 &。 值 进行 简单 选择 排序 ,再 按 &, 值 进行 直接 插入 排序 。 

这 里 是 按 两 个 关键 字 排 序 , 越 重要 的 关键 字 越 在 后 面 排序 ,所 以 应 先 按 &。 值 排序 再 
按 k 值 排 序 。 在 简单 选择 排序 和 直接 插入 排序 中 前 者 是 不 稳定 的 ,后 者 是 稳定 的 。 当 先 按 
ks 值 进行 直接 插入 排序 ,再 按 ki 值 进 行 简 单 选择 排序 时 ,由 于 简单 选择 排序 的 不 稳定 性 ,可 
能 会 造成 & 值 相同 而 k 值 大 的 元 素 排 在 前 面 ,这 不 符合 要 求 ,所 以 应 该 先 按 心 值 进行 简 
单 选择 排序 ,再 按 & 值 进行 直接 插入 排序 ,答案 是 (4) 。 

正 是 因为 不 同 的 排序 方法 适应 不 同 的 应 用 环境 和 要 求 , 所 以 选择 合适 的 排序 方法 应 综 
合 考虑 下 列 因素 

(1) 待 排序 的 元 素数 目 x( 问 题 规模 ) 。 




















(2) 元 素 的 大 小 (每 个 元 素 的 规模 ) 。 ~ 


(3) 关键 字 的 结构 及 其 初始 状态 。 

(4) 对 稳定 性 的 要 求 。 

(5) 语言 工具 的 条 件 。 

(6) 数据 的 存储 结构 。 

(7) 时 间 和 空间 复杂 度 等 。 

没有 哪 一 种 排序 方法 是 绝对 好 的 。 每 一 种 排序 方法 都 有 其 优 缺 点 ,适合 于 不 同 的 环境 ， 
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因此 在 实际 应 用 中 应 根据 具体 情况 做 选择 。 首 先 考虑 排序 对 稳定 性 的 要 求 , 若 要 求 稳 定 , 则 
只 能 在 稳定 方法 中 选取 ,否则 可 以 在 所 有 方法 中 选取 ; 其 次 要 考虑 待 排序 元 素 个 数 的 大 
小 ,车 nn 较 大 , 则 可 在 改进 方法 中 选取 ,否则 在 简单 方法 中 选取 ; 然后 再 考虑 其 他 因素 。 下 
面 给 出 综合 考虑 了 以 上 几 个 方面 所 得 出 的 大 致 结论 : 

(1) 车 nn 较 小 (如 三 50), 可 采用 直接 插入 或 简单 选择 排序 。 一 般 地 ,这 两 种 排序 方法 
中 ,直接 插入 排序 较 好 ,但 简单 选择 排序 移动 的 元 素数 少 于 直接 插入 排序 。 

(2) 若 文件 初始 状态 基本 有 序 (指正 序 ) , 则 选用 直接 插入 或 冒 泡 排序 为 宜 。 

(3) 车 nn 较 大 ,应 采用 时 间 复 杂 度 为 O(nlogzn) 的 排序 方法 ,例如 快速 排序 、 堆 排序 或 二 
路 归并 排序 。 快 速 排序 是 目前 基于 比较 的 内 排序 中 被 认为 是 较 好 的 方法 , 当 待 排序 的 关键 
字 是 随机 分 布 时 ,快速 排序 的 平均 时 间 最 少 ; 但 堆 排序 所 需 的 辅助 空间 少 于 快速 排序 ,并 且 

不 会 出 现 快速 排序 可 能 出 现 的 最 坏 情况 。 这 两 种 排序 都 是 不 稳定 的 , 若 要 求 排 序 稳定 , 则 可 
选用 二 路 归并 排序 。 

(4) 若 需要 将 两 个 有 序 表 合 并 成 一 个 新 的 有 序 表 ,最 好 用 二 路 归并 排序 方法 。 

(5) 基数 排序 可 能 在 O(n) 时 间 内 完成 对 个 元 素 的 排序 。 但 遗憾 的 是 ,基数 排序 只 适 
用 于 像 字符 串 和 整数 这 类 有 明显 结构 特征 的 关键 字 , 而 当 关 键 字 的 取 值 范 围 属于 某 个 无 穷 
集合 (例如 实数 型 关键 字 ) 时 无 法 使 用 基数 排序 ,这 时 只 有 借助 于 “比较 ”的 方法 来 排序 。 
此 可 知 ,车 很 大 ,元 素 的 关键 字 位 数 较 少 且 可 以 分 解 时 采用 基数 排序 较 好 。 


二 本 章 小 结 一 过 一 




















本 章 的 基本 学 习 要 点 如 下 : 扫 -- 扫 
(1) 理解 排序 的 基本 概念 ,包括 排序 的 稳定 性 、 内 排序 和 外 排序 之 间 的 

差异 。 
(2) 掌握 插入 排序 算法 ,包括 直接 插入 排序 ,. 折 半 插 入 排序 和 希 尔 排序 

的 过 程 和 算法 实现 。 视频 讲解 


(3) 掌握 交换 排序 算法 ,包括 冒 泡 排序 和 快速 排序 的 过 程 和 算法 实现 。 
(4) 掌握 选择 排序 算法 ,包括 直接 选择 排序 和 堆 排 序 的 过 程 和 算法 实现 。 
(5) 掌握 二 路 归并 排序 的 过 程 和 算法 实现 。 

(6) 掌握 基数 排序 的 过 程 和 算法 实现 。 

(7) 掌握 各 种 排序 方法 的 比较 和 选择 。 

(8) 灵活 地 运用 各 种 排序 算法 解决 一 些 综合 应 用 问题 。 








一 人 练习 题 10 -一 ~ 


1. 直接 插入 排序 算法 在 含有 个 元 素 的 初始 数据 正 序 、 反 序 和 数据 全 部 相等 时 时 间 复 
杂 度 各 是 多 少 ? 

2. 回答 以 下 关于 直接 插入 排序 和 折 半 插入 排序 的 问题 : 

(1) 使 用 折 半 插入 排序 所 要 进行 的 关键 字 比 较 次 数 是 否 与 待 排 序 的 元 素 的 初始 状态 
有 关 ? 
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(2) 在 一 些 特殊 情况 下 , 折 半 搬入 排序 比 直接 插入 排序 要 执行 更 多 的 关键 字 比 较 ,这 名 
话 对 吗 ? 
3. 有 以 下 关于 排序 的 算法 : 


void fun(int a[] ,int n) 
{ inti,j,d,tmp; 
d=n/3; 
while (true) 
{ for (i=d;ii<nii 十 十 ) 
{ tmp 一 a 口 ; 
j=i—d; 
while (j >=0 && tmp<a[D]) 
{ ab+d=a0]; 
二 由 
} 
aD+d]=tmp; 
} 
if (d==1) break; 
else ii (d<3) d=1; 
else d=d/3; 


} 


(1) 指出 fun(a,n) 算 法 的 功能 。 

(2) 当 a[] 二 {5,1,3,6,2,7,4,8} 时 , 问 fun(a,8) 共 执行 几 趋 排序 ? 各 趟 的 排序 结果 是 
什么 ? 

4. 在 实现 快速 排序 的 非 递归 算法 时 ,可 根据 基准 元 素 将 待 排序 序列 划分 为 两 个 子 序 
列 。 若 下 一 趟 首先 对 较 短 的 子 序列 进行 排序 , 试 证 明 在 此 做 法 下 快速 排序 所 需要 的 栈 的 深 
度 为 O(logsn)。 

5. 将 快速 排序 算法 改 为 非 递归 算法 时 通常 使 用 一 个 栈 , 若 把 栈 换 为 队列 会 对 最 终 排序 
结果 有 什么 影响 ? 

6. 在 堆 排序 \ 快 速 排序 和 二 路 归并 排序 中 : 

(1) 若 只 从 存储 空间 考虑 ,应 首先 选取 哪 种 排序 方法 ,其 次 选取 哪 种 排序 方法 ,最 后 选 
取 哪 种 排序 方法 ? 

(2) 若 只 从 排序 结果 的 稳定 性 考虑 , 则 应 选取 哪 种 排序 方法 ? 

(3) 若 只 从 最 坏 情况 下 的 排序 时 间 考 虑 , 则 不 应 选取 哪 种 排序 方法 ? 





7. 如 果 只 想 在 一 个 及 个 元 素 的 任意 序列 中 得 到 其 中 最 小 的 第 (4 二 二 个 元 素 之 前 J 


的 部 分 排序 序列 ,那么 最 好 采用 什么 排序 方法 ? 为 什么 ? 例如 有 一 个 序列 (57.40,38,11， 
13,34,48,75,6,19,9,7) ,要 得 到 其 第 4 个 元 素 (k 二 4) 之 前 的 部 分 有 序 序列 ,用 所 选择 的 算 
法 实现 时 ,要 执行 多 少 次 比较 ? 

8. 在 基数 排序 过 程 中 用 队列 暂 存 排序 的 元 素 . 是 否 可 以 用 栈 来 代替 队列 ? 为 什么 ? 

9. 线性 表 有 顺序 表 和 链表 两 种 存储 方式 ,不 同 的 排序 方法 适合 不 同 的 存储 结构 。 对 于 
常见 的 内 部 排序 方法 ,说 明 哪 些 更 适合 于 顺序 表 ? 哪些 更 适合 于 链表 ? 哪些 两 者 都 适合 ? 
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10. 设 一 个 整数 数组 a[0..n 一 1] 中 存 有 互 不 相同 的 个 整数 , 且 每 个 元 素 的 值 均 在 1 一 
nn 之 间 。 设 计 一 个 算法 在 O(n) 时 间 内 将 a 中 的 元 素 递增 排序 ,将 排序 结果 放 在 另 一 个 同样 
大 小 的 数组 5 中 。 

11. 设计 一 个 双向 冒 泡 排序 的 算法 , 即 在 排序 过 程 中 交替 改变 扫描 方向 。 

12. 假设 及 个 关键 字 不 同 的 记录 存 于 顺序 表 中 ,要求 不 经 过 整体 排序 从 中 选 出 从 大 
到 小 顺序 的 前 m(m 二 过 nn) 个 元 素 。 试 采用 简单 选择 排序 算法 实现 此 选择 过 程 。 

13. 对 于 给 定 的 含有 个 元 素 的 无 序数 据 序列 (所 有 元 素 的 关键 字 不 相同 ) ,利用 快速 
排序 方法 求 这 个 序列 中 第 k(1<k<n) 小 元 素 的 关键 字 , 并 分 析 所 设计 算法 的 最 好 和 平均 时 
间 复 杂 度 。 

14. 设 n 个 记录 R[L0..n 一 1] 的 关键 字 只 取 3 个 值 , 即 0.1、2, 采 用 基数 排序 方法 将 这 ? 
个 记录 排序 ,并 用 相关 数据 进行 测试 。 


一 > 上 机 实验 题 10 -一 


其 验证 性 实验 

实验 题 1: 实现 直接 插入 排序 算法 

目的 : 领会 直接 插入 排序 的 过 程 和 算法 设计 。 

内 容 : 编写 一 个 程序 exp10-1. cpp 实现 直接 插入 排序 算法 ,用 相关 数据 进行 测试 并 输 
出 各 趟 的 排序 结果 。 

实验 题 2: 实现 折 半 插入 排序 算法 

目的 : 领会 折 半 插入 排序 的 过 程 和 算法 设计 。 

内 容 : 编写 一 个 程序 exp10-2. cpp 实现 折 半 插入 排序 算法 ,用 相关 数据 进行 测试 并 输 
出 各 赵 的 排序 结果 。 

实验 题 3: 实现 希 尔 排序 算法 

目的 : 领会 希 尔 排 序 的 过 程 和 算法 设计 。 

内 容 : 编写 一 个 程序 exp10-3. cpp 实现 希 尔 排 序 算法 ,用 相关 数据 进行 测试 并 输出 各 
趟 的 排序 结果 。 

实验 题 4: 实现 冒 泡 排序 算法 

目的 : 领会 冒 泡 排序 的 过 程 和 算法 设计 。 

内 容 : 编写 一 个 程序 exp10-4. cpp 实现 冒 泡 排序 算法 ,用 相关 数据 进行 测试 并 输出 各 
趟 的 排序 结果 。 

实验 题 5: 实现 快速 排序 算法 

目的 : 领会 快速 排序 的 过 程 和 算法 设计 。 

内 容 : 编写 一 个 程序 exp10-5. cpp 实现 快速 排序 算法 ,用 相关 数据 进行 测试 并 输出 各 
次 划分 后 的 结果 。 


实验 题 6: 实现 简单 选择 排序 算法 
目的 : 领会 简单 选择 排序 的 过 程 和 算法 设计 。 
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内 容 : 编写 一 个 程序 exp10-6. cpp 实现 简单 选择 排序 算法 ,用 相关 数据 进行 测试 并 输 
出 各 趟 的 排序 结果 。 


实验 题 7: 实现 堆 排序 算法 

目的 : 领会 堆 排 序 的 过 程 和 算法 设计 。 

内 容 : 编写 一 个 程序 exp10-7. cpp 实现 堆 排序 算法 ,用 相关 数据 进行 测试 并 输出 各 趟 
的 排序 结果 。 

实验 题 8: 实现 二 路 归并 排序 算法 

目的 : 领会 二 路 归并 的 过 程 和 算法 设计 。 

内 容 : 编写 一 个 程序 exp10-8. cpp 实现 二 路 归并 排序 算法 ,用 相关 数据 进行 测试 并 输 
出 各 趟 的 排序 结果 。 


实验 题 9: 实现 基数 排序 算法 

目的 : 领会 基数 排序 的 过 程 和 算法 设计 。 

内 容 : 编写 一 个 程序 exp10-9. cpp 实现 基数 排序 算法 ,用 相关 数据 进行 测试 并 输出 各 
趟 的 排序 结果 。 
其 设计 性 实验 

实验 题 10: 实现 可 变 长 度 的 字符 串 序列 快速 排序 算法 

目的 : 掌握 快速 排序 算法 及 其 应 用 。 

内 容 : 某 个 待 排序 的 序列 是 一 个 可 变 长 度 的 字符 串 序列 ,这 些 字 符 串 一 个 接 一 个 地 存 
储 于 单个 字符 数组 中 ,采用 快速 排序 方法 对 这 个 字符 串 序列 进行 排序 ,并 编写 一 个 对 以 下 数 
据 进行 排序 的 程序 exp10-10. cpp: 


char S[] = {"whileifif—elsedo— whileforcase") ; 

struct node 

{int start; // 该 字符 串 在 S 中 的 起 始 位 置 
int length; // 该 字符 串 的 长 度 

} A[]={{0,5}, {5,2}), {7,7}, {14,8}, {22,3}, {25,4}}; 


实验 题 11: 实现 英文 单词 按 字典 序 排列 的 基数 排序 算法 

目的 : 掌握 基数 排序 算法 及 其 应 用 。 

内 容 : 编写 一 个 程序 exp10-11. cpp, 采 用 基数 排序 方法 将 一 组 英文 单词 按 字典 序 排列 。 
假设 单词 均 由 小 写字 母 或 空格 构成 .最 长 的 单词 有 MaxLen 个 字母 ,用 相关 数据 进行 测试 并 





i 字 结 o 
输出 各 赵 的 排序 结果 — 


戎 综合 性 实验 

实验 题 12: 实现 学 生 信息 的 多 关键 字 排 序 

目的 : 掌握 基数 排序 算法 设计 及 其 应 用 。 

内 容 : 假设 有 很 多 学 生 记录 ,每 个 学 生 记录 包含 姓名 .性 别 和 班 号 ,设计 一 个 算法 按 班 
号 .性 别 有 序 输出 , 即 先 按 班 号 输出 ,同一 个 班 的 学 生 按 性 别 输出 , 班 号 为 1001 一 1030。 编 
写 一 个 程序 exp10-12. cpp 实现 上 述 功能 。 


数据 结构 教程 \ 目 GO 





实验 题 13: 求 各 种 排序 算法 的 绝对 执行 时 间 

目的 : 掌握 各 种 内 排序 算法 设计 及 其 比较 。 

内 容 : 编写 一 个 程序 exp10-13. cpp, 随 机 产生 个 1~99 的 正 整数 序列 ,分 别 采 用 直接 
插入 排序 、 折 半 插 和 人 排序 ` 希 尔 排序 、 冒 泡 排 序 、 快 速 排序 简单 选择 排序 、 堆 排序 和 二 路 归并 
排序 算法 对 其 递增 排序 , 求 出 每 种 排序 方法 所 需要 的 绝对 时 间 。 





EE 





第 10 章 介 绍 的 内 排序 都 是 在 内 存 中 进行 的 , 如 果 参 与 排序 的 
数据 量 特别 大 , 存放 在 外 存 文 件 中 , 一 次 不 能 全 部 读 入 内 存 , 用 内 排 
序 方 法 就 不 能 完成 对 数据 的 整体 排序 。 为 此 采用 分 段 处 理 , 每 次 将 
文件 中 一 部 分 数据 调 到 内 存 中 进行 排序 , 这 样 在 排序 过 程 中 需要 进 
行 多 次 的 内 、 外 存 之 间 的 数据 交换 , 称 这 种 排序 为 外 排序 。 

本 章 介绍 外 排序 的 基本 算法 , 包括 磁盘 排序 和 磁带 排序 。 
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文件 存储 在 外 存 上 ,因此 外 排序 方法 与 各 种 外 存 设备 的 特征 有 关 , 外 存 设备 大 体 上 可 以 
分 为 两 类 ,一 类 是 顺序 存 取 设 备 ,例如 磁带 , 另 一 类 是 直接 存 取 设 备 ,例如 磁盘 。 

磁带 (tape) 出 现在 20 世纪 50 年 代 早期 ,是 一 种 典型 的 顺序 存 取 设 备 ， 
它 是 通过 读 写 头 读 写 数据 的 。 磁 带 对 于 检索 和 修改 操作 都 很 不 方便 ,其 主 
要 用 于 处 理 很 少 需要 修改 的 并 且 进行 顺序 存 取 的 信息 ,特别 用 作 备份 数据 
的 设备 。 

磁盘 是 一 种 直接 存 取 的 外 存 设备 , 它 不 仅 能 够 进行 顺序 存 取 , 而 且 能 直 “、 记 师 
接 存 取 任何 记录 , 它 的 存 取 速 度 比 磁带 快 得 多 。 磁 盘 分 为 硬盘 和 软盘 两 种 ， 
硬盘 的 容量 比 软盘 大 得 多 ,而 且 存 取 速 度 也 比 软盘 快 得 多 。 

目前 磁盘 多 使 用 带 有 可 移动 式 的 磁头 ,图 11. 1 所 示 
为 磁盘 结构 示意 图 ,从 中 可 以 看 到 ,整个 磁盘 由 多 个 盘 片 
组 成 ,固定 在 同一 轴 上 沿 一 个 固定 方向 高 速 旋转 ,每 个 盘 
片 包 括 上 、 下 两 个 盘面 ,每 个 盘面 用 于 存储 信息 ,每 个 盘 
面 有 一 个 读 写 头 ,所 有 读 写 头 是 固定 在 一 起 同时 同步 移 
动 的 。 在 一 个 盘面 上 读 写 头 的 轨迹 称 为 磁道 ,磁道 就 是 
磁 面 上 的 圆 环 。 各 个 磁 面 上 半径 相同 的 磁道 总 和 称 为 一 
个 柱 面 。 在 一 个 磁道 内 又 分 为 若干 个 扇面 。 一 般 情况 图 11.1 磁盘 结构 示意 图 
下 ,把 一 次 向 磁盘 写 和 或 读 出 的 数据 称 为 一 个 物理 块 ,一 
个 物理 块 通常 由 若干 个 记录 组 成 。 

对 于 磁盘 而 言 ,影响 存 取 时 间 的 因素 有 3 个 , 即 搜索 时 间 ( 磁 头 定 位 到 指定 柱 面 所 需要 
的 时 间 )、 等 待 时 间 ( 磁 头 定位 到 磁道 的 指定 扇 区 所 需要 的 时 间 ) 和 传送 时 间 ( 从 磁盘 或 向 磁 
盘 传 送 一 个 物理 块 的 数据 所 需要 的 时 间 )。 

外 排序 的 基本 方法 是 归并 排序 法 , 它 分 为 以 下 两 个 步骤 。 

(1) 生成 若干 初始 归并 段 ( 顺 串 ) : 将 一 个 文件 ( 含 待 排序 的 数据 ) 中 的 数据 分 段 读 入内 
存 ,在 内 存 中 对 其 进行 内 排序 ,并 将 经 过 排序 的 数据 段 ( 有 序 段 ) 写 到 多 个 外 存 文 件 上 。 

(2) 多 路 归并 : 对 这 些 初 始 归并 段 进行 多 遍 归 并 ,使 得 有 序 的 归并 段 逐 渐 扩 大 ,最 后 在 
外 存 上 形成 整个 文件 的 单一 归并 段 , 也 就 完成 了 这 个 文件 的 外 排序 。 

从 中 可 以 看 出 ,外 排序 的 时 间 主 要 花费 在 内 、 外 存 数据 的 交换 (对 应 存 取 时 间 ) 和 内 排序 上 。 
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11.21 磁盘 排序 概述 
对 存放 在 磁盘 中 的 文件 进行 排序 属于 典型 的 外 排序 , 称 为 磁盘 排序 (disk sort)。 由 于 
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磁盘 是 直接 存 取 设备 , 读 写 一 个 数据 块 的 时 间 与 当前 读 写 头 所 处 的 位 置 关 系 不 大 ,所 以 可 以 
通过 读 写 数据 块 的 次 数 来 衡量 存 取 时 间 。 

图 11. 2 所 示 为 基本 的 磁盘 排序 过 程 ,磁盘 中 的 Fi 文件 包括 待 排序 的 数据 ,通过 相关 算 
法 将 Fi 文件 中 的 记录 一 部 分 一 部 分 地 调和 人 内存 处 理 , 产 生 若 干 个 文件 Fi 一 忆 ,它们 都 是 有 
序 的 , 称 为 顺 串 (runs)。 然 后 再 次 将 Fi ~F, 文件 中 的 记录 调 入 内 存 ,通过 相关 归并 算法 产 
生 一 个 有 序 文件 Fu ,从 而 达到 数据 排序 的 目的 。 
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生成 若干 初始 归并 段 归并 成 一 个 有 序 文件 
图 11.2 基本 的 磁盘 排序 过 程 


下 面 通过 一 个 例子 来 说 明 磁盘 排序 过 程 。 设 有 一 个 文件 Fi, ,内 含 4500 个 记录 , 即 R,， 
Rs，… ,Riso ,现在 要 对 该 文件 进行 排序 ,但 内 存 空 间 最 多 只 能 对 w=750 个 记录 进行 排序 ， 
并 假设 磁盘 每 次 读 写 单 位 为 250 个 记录 的 数据 块 ( 即 一 个 物理 块 , 对 应 250 个 逻辑 记录 ,也 
称 为 页 块 ) ,其 排序 过 程 如 下 。 

(1) 生成 初始 归并 段 : 每 次 读 3 个 数据 块 (750 个 记录 ) 进 行内 排序 (由 于 这 些 数据 全 部 
在 内 存 中 ,可 以 采用 第 10 章 介绍 的 内 排序 方法 ) ,整个 文件 得 到 6 个 归并 段 已 一 Fe( 即 初始 
归并 段 ) ,把 这 6 个 归并 段 存放 到 磁盘 上 。 

(2) 二 路 归并 : 将 内 存 工作 区 分 为 3 块 , 每 块 可 容纳 250 个 记录 ,把 其 中 两 块 作为 输入 
缓冲 区 , 另 一 块 作为 输出 缓冲 区 。 

先 对 归并 有 段 F 和 Ps 进行 归并 ,为 此 可 把 这 两 个 归并 段 中 每 一 个 归并 有 段 的 第 一 个 物理 
块 (250 个 记录 ) 读 入 输入 缓冲 区 ,再 把 输入 缓冲 区 的 这 两 个 归并 段 的 物理 块 加 以 归并 (采用 
内 排序 的 二 路 归并 过 程 ), 送 入 输出 缓冲 区 。 当 输出 缓冲 区 满 时 ,就 把 它 写 入 磁盘 ; 当 一 个 
输入 缓冲 区 腾空 时 , 便 把 同一 归并 段 中 的 下 一 物理 块 读 入 ,这 样 不 断 进行 ,直到 归并 段 Fi 
与 归并 段 F 的 归并 完成 为 止 (将 其 结果 存放 在 F; 文件 中 ) 。 

再 归并 F 和 F (结果 存放 在 Fs 文件 中 ) ,最 后 归并 Fs 和 Fs (结果 存放 在 F 文件 中 )， 





到 此 为 止 归 并 过 程 已 对 整个 文件 的 所 有 记录 扫描 一 遍 。 扫 描 一 遍 意味 着 文件 中 的 每 一 个 记 aa 


录 被 读 写 一 次 ( 即 从 磁盘 上 读 和 内 存 一 次 ,并 从 内 存 写 到 磁盘 一 次 ) ,并 在 内 存 中 参加 一 次 归 
并 。 这 一 遍 扫 描 所 产生 的 结果 为 3 个 归并 段 F; ~F, ,每 个 段 含 6 个 物理 块 , 合 1500 个 记录 。 
再 用 上 述 方法 把 其 中 的 F; 和 Fs 两 个 归并 段 归 并 起 来 (将 其 结果 存放 在 Fi 文件 中 ,其 
大 小 为 3000 个 记录 的 归并 段 ); 最 后 将 Fl。 和 Fs 两 个 归并 段 进行 归并 ,从 而 得 到 所 求 的 排 
序 文件 Fo。 图 11. 3 显示 了 这 个 归并 过 程 。 
从 归并 过 程 可 见 ,扫描 的 遍 数 对 于 归并 过 程 所 需要 的 存 取 时 间 起 着 关键 的 作用 。 在 这 
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11.3 6 个 归并 有 段 的 归并 过 程 


个 例子 中 ,除了 在 内 排序 形成 初始 归并 段 时 需 做 一 遍 扫描 外 ,各 归并 段 的 归并 还 需 2 三 遍 扫 


描 : 把 6 个 长 度 为 750 个 记录 的 归并 段 归并 为 3 个 长 度 为 1500 个 记录 的 归并 段 需要 扫描 
一 遍 ; 把 两 个 长 度 为 1500 个 记录 的 归并 段 归 并 为 一 个 长 度 为 3000 个 记录 的 归并 段 需 要 扫 


撒 孔 遍 ， 把 一 个 长 度 为 3000 个 记录 的 归并 段 与 另 一 个 长 度 为 1500 个 记录 的 归并 段 进行 归 


并 需要 扫描 一 遍 。 显然, 减少 对 数据 的 扫描 遍 数 可 以 减少 存 取 时 间 , 从 而 提高 排序 速度 。 

由 于 磁盘 的 读 写 是 以 物理 块 为 单位 的 ,而 一 个 物理 块 可 能 包含 多 个 记录 ,在 实际 中 读 写 
物理 块 的 次 数 与 很 多 因素 有 关 , 难 以 计算 。 为 了 简单 ,假设 一 个 物理 块 只 存放 一 个 记录 ,这 
样 读 写 物理 块 次 数 转变 为 读 写 记 录 次 数 。 

例如 ,对 于 图 11. 3 , 若 一 个 物理 块 只 存放 一 个 记录 , 则 在 整个 归并 过 程 中 读 记录 的 次 数 
恰好 等 于 带 权 路 径 长 度 , 即 : 

WPL = (750 十 75 十 750 十 750) X3 十 (750 十 750) X 2 = 12 000 

它 正 好 表示 各 归并 段 的 归并 需要 2 三 遍 扫 措 。 写 记 录 次 数 与 读 记录 次 数 相等 ,也 为 
12 000 次 。 后 面 均 假设 一 个 物理 块 只 存放 一 个 记录 。 

归纳 起 来 ,影响 磁盘 排序 时 间 性 能 的 主要 因素 如 下 

(1) 读 写 记录 次 数 。 

(2) 关键 字 比 较 次 数 。 

不 同 于 内 排序 ,磁盘 排序 中 元 素 移 动 的 次 数 相对 上 述 两 个 因素 可 以 忽略 ,所 以 一 般 不 考 
虑 元 素 移动 的 时 间 开 销 。 

因此 可 以 大 致 认为 磁盘 排序 时 间 三 读 写 记录 次 数 十 关键 字 比 较 次 数 。 

由 于 磁盘 排序 主要 包含 生成 初始 归并 段 和 多 路 归并 两 个 阶段 ,所 以 在 这 两 个 阶段 中 尽 
可 能 选择 好 的 方法 减少 上 述 两 个 因素 的 影响 。 


11.22 生成 初始 归并 段 


一 般 情 况 下 ,初始 归并 段 的 个 数 越 多 ,多 路 归并 的 性 能 越 差 。 如 果 采 用 第 10 章 中 介绍 
的 内 排序 方法 来 生成 初始 归并 段 ,生成 的 归并 有 段 的 大 小 正好 等 于 一 次 能 放 入 内 存 中 的 记录 
个 数 wm, 当 冯 相对 较 小 时 产生 的 初始 归并 段 较 多 。 这 里 介绍 一 种 置换 -选择 排序 算法 用 于 
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生成 长 度 较 大 的 初始 归并 段 ,从 而 减少 初始 归并 段 的 个 数 。 

置换 -选择 排序 (replacement selection sorting) 算 法 的 基本 步骤 如 下 : 

(1) 从 待 排序 文件 Fas 中 按 内 存 工作 区 WA 的 容量 ( 设 为 w) 读 入 w 个 
记录 。 设 归并 段 编号 ;一 1。 

(2) 从 WA 中 选 出 关键 字 最 小 的 记录 Re 。 

(3) 将 Rn 记录 输出 到 文件 F; 中 ,作为 当前 归并 有 段 的 一 个 记录 。 

(4) 车 ,不 空 , 则 从 Fs 中 读 入 下 一 个 记录 到 WA 中 代替 刚 输出 的 记录 。 9 壮 

(5) 在 WA 工作 区 中 所 有 大 于 或 等 于 Ris 的 记录 中 选择 出 最 小 记录 作为 新 的 Ran， 
转 (3) ,直到 选 不 出 这 样 的 Rw。 

(6) 置 ;二 ;十 1, 开 始 一 个 新 的 归并 段 。 

(7) 车 WA 工作 区 已 空 , 则 初始 归并 段 已 全 部 产生 ,算法 结束 ; 否则 转 (2) 。 

【 例 11.1】 设 磁盘 文件 中 共有 18 个 记录 ,记录 的 关键 字 分 别 为 (15,4,97,64,17,32， 
108,44,76,9,39,82,56,31,80,73,255,68), 若 内 存 工 作 区 可 容纳 5 个 记录 ,用 置换 -选择 排 
序 算 法 可 产生 几 个 初始 归并 段 ,每 个 初始 归并 段 包含 哪些 记录 ? 

初始 归并 段 的 生成 过 程 如 表 11.1 所 示 。 


表 11.1 初始 归并 段 的 生成 过 程 


















































读 人 记录 内 存 工作 区 状态 Ron 输出 之 后 的 初始 归并 段 状态 
15,4,97,64,17|15,4,97,64,17 4(i=1) 归并 段 1:{4}》 
32 15,32,97,64,17 |15 归并 段 1:{4,15) 
108 108,32,97,64,17 |17 归并 段 1:{4,15,17)} 
44 108,32,97,64,44 |32 归并 段 1:{4,15,17,32} 
76 108,76,97,64,44 |44 归并 段 1:{4,15,17,32,44} 
9 108,76,97,64,9 |64 归并 段 1:{4,15,17,32,44,64} 
39 108,76,97,39,9 |76 归并 段 1:{4,15,17,32,44,64,76} 
82 108,82,97,39,9 |82 归并 段 1:{4,15,17,32,44,64,76 ,82} 
56 108,56,97,39,9 |97 归并 段 1:{4,15,17,32,44,64,76,82,97} 
31 108,56,31,39,9 |108 归并 段 1:{4,15,17,32,44,64,76,82,97,108} 
有 9( 没 有 三 108 的 记 | 归 并 段 1:{4,15,17,32,44,64,76,82,97,108} 


录 ,i 增 1,i=2) 归并 段 2:{9} 
归并 段 1:{4,15,17,32,44,64,76,82,97,108} 











多 0,56,31,39， 

3 80,56,31,39,9 “|31 归并 眉 2.19 31) 
归并 段 1:{4,15,17,32,44,64,76,82,97,108} 

255 80,56,255,39,73 |39 归并 眉 2:(9,31,39) 

68 80,56,255,68,73 |56 归并 段 1:{4,15,17,32,44,64,76,82,97,108} 


归并 段 2:{9,31,39,56} 








a 归并 段 2:{9,31,39,56,68} 


归并 段 1:{4,15,17,32,44,64,76,82,97,108} 











得 认 归并 段 2:{9,31,39,56,68,73} 
归并 段 1:{4,15,17,32,44,64,76,82,97,108} 
0,,255,, 0 
并 半天 人 归并 段 2:{9,31,39,56,68,73,80)} 
,255，， 255 归并 段 1:{4,15,17,32,44,64,76,82,97,108} 


归并 段 2:{9,31,39,56,68,73,80,255} 














归并 段 1:{4,15,17,32,44,64,76,82,97,108} aa 
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这 里 共产 生 了 两 个 初始 归并 段 , 归 并 段 已 为 (4,15,17,32,44,64,76,82,97,108) , 归 
并 段 Fs 为 (9,31,39,56,68,73,80,255) 。 

显然 ,置换 -选择 排序 算法 生成 的 初始 归并 段 的 长 度 既 与 内 存 工作 区 WA 的 大 小 有 关 ， 
也 与 输入 文件 中 记录 的 排列 次 序 有 关 。 可 以 证 明 , 如 果 输 入 文件 中 的 记录 按 关 键 字 随机 排 
列 , 所 得 到 的 初始 归并 段 的 平均 长 度 为 内 存 工作 区 大 小 的 两 倍 。 

在 置换 -选择 排序 算法 中 ,内 存 工 作 区 WA 内 频繁 的 操作 是 ,从 w 个 记录 中 选择 一 个 关 
键 字 最 小 的 记录 。 如 果 采 用 基于 简单 选择 排序 方法 ,每 次 操作 需要 w 一 1 次 比较 , 若 输入 文 
件 有 zn 个 记录 , 则 算法 的 时 间 复 杂 度 为 O(nw) 。 

实际 上 ,这 种 频繁 的 操作 可 以 采用 败 者 树 来 实现 ,从 w 个 记录 中 选择 一 个 关键 字 最 小 
的 记录 的 时 间 为 O(logzrw) ,从 而 使 置换 -选择 排序 算法 的 时 间 复 杂 度 降低 为 O(n log:)。 
败 者 树 将 在 后 面 介绍 。 


11.23 多 路 平衡 归并 


所 谓 二 路 平衡 归并 (2-way balanced merge) 就 是 每 一 趟 从 m 个 归 段 得 到 | /2 | 个 归并 
段 ,图 11.3 所 示 的 归并 可 以 看 成 是 二 路 平衡 归并 ,这 样 的 归并 树 就 有 [logsm | 十 1 层 , 需 要 
对 初始 数据 进行 | log*m | 遍 扫 描 。 做 类 似 的 推广 , 当 采 用 路 平衡 归并 时 ,相应 的 归并 树 有 
[ogwm | 十 1 层 , 要 对 数据 进行 ;二 [logwm |] 遍 扫描 ,显然 ,上 越 大 ,磁盘 读 写 次 数 越 少 。 那 么 
是 不 是 上 越 大 ,归并 的 总 效率 就 越 好 呢 ? 扫 - 提 

在 进行 k 路 归并 时 ,在 个 记录 中 选择 最 小 者 ,如 果 采 用 基于 简单 选择 
排序 方法 ,需要 进行 一 1 次 关键 字 比 较 。 每 趟 归并 个 记录 需要 做 (4 一 1) X 
(一 1) 次 关键 字 比 较 , 则 * 趟 归并 总 共 需 要 的 关键 字 比 较 次 数 为 : : 5 

SX (一 1) X (一 1) 一 | log |X (u—1) x (一 1) 视频 讲解 
一 [log:mm |X (u—1) x (k—1)/[logsk | 

从 中 可 以 看 出 ,在 初始 归并 段 个 数 m 与 记录 个 数 确定 时 ,其 中 的 [logsm | X (u 一 1) 
是 常量 ,而 (4 一 1)/|logsk | 随 着 & 的 增 大 而 增 大 。 

因此 ,车 初始 归并 有 段 个 数 m 与 记录 个 数 确定 ,在 选择 几 路 归并 方案 时 ,尽管 增 大 归并 
路 数 & 会 减少 磁盘 读 写 次 数 ,但 人 增 大 会 增加 关键 字 比 较 次 数 。 当 & 增 大 到 一 定 的 程度 ,就 
会 抵消 掉 由 于 减少 磁盘 读 写 次 数 而 赢得 的 时 间 。 

也 就 是 说 ,在 路 平衡 归并 中 ,如 果 采 用 基于 简单 选择 排序 方法 ,其 效率 并 非 & 越 大 , 归 
并 的 效率 就 越 好 。 

















2 利用 几 者 树 的 六 路 平衡 归并 
利用 败 者 树 实现 k 路 平衡 归并 的 过 程 是 先 建立 败 者 树 ,然后 对 k 个 输入 有 序 段 进行 & 
路 平衡 归并 。 


败 者 树 (tree of loser) 是 一 棵 有 A 个 叶子 结 点 的 完全 二 叉 树 (可 将 大 根 堆 看 成 胜 者 树 )， 
其 中 叶子 结 点 存储 参与 归并 的 记录 ,分 支 结 点 存放 关键 字 对 应 的 段 号 。 所 谓 败 者 是 两 个 记 
录 比 较 时 关键 字 较 大 者 , 胜 者 是 两 个 记录 比较 时 关键 字 较 小 者 。 

建立 败 者 树 是 采用 类 似 于 堆 调整 的 方法 实现 的 ,初始 时 令 所 有 的 分 支 结 点 指向 一 个 含 最 
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小 关键 字 (MINKEY) 的 叶子 结 点 ,然后 从 各 叶子 结 点 出 发 调整 分 支 结 点 为 新 的 败 者 即 可 。 

对 & 个 有 序 段 进行 上 路 平衡 归并 的 方法 如 下 : 

(1) 取 每 个 输入 有 序 段 的 第 一 个 记录 作为 败 者 树 的 叶子 结 点 ,建立 初始 败 者 树 : 两 两 
叶子 结 点 进行 比较 ,在 双亲 结 点 中 存放 比较 的 败 者 (关键 字 较 大 者 ) ,而 让 胜 者 去 参加 更 高 一 
层 的 比赛 ,如 此 在 根 结 点 之 上 胜出 的 “冠军 ”是 关键 字 最 小 者 。 

(2) 将 胜出 的 记录 写 至 输出 归并 段 ,在 对 应 的 叶子 结 点 处 补充 其 输入 有 序 段 的 下 一 个 
记录 , 若 该 有 序 段 变 空 , 则 补充 一 个 大 关键 字 ( 比 所 有 记录 关键 字 都 大 , 设 为 ees) 的 虚 记录 。 

(3) 调整 败 者 树 ,选择 新 的 关键 字 最 小 的 记录 : 从 补充 记录 的 叶子 结 点 向 上 和 双亲 结 
点 的 关键 字 比 较 , 败 者 留 在 该 双亲 结 点 , 胜 者 继续 向 上 ,直到 树 的 根 结 点 ,最 后 将 胜 者 放 在 根 
结 点 的 双亲 结 点 中 。 

(4) 若 胜出 的 记录 关键 字 等 于 es, 则 归并 结束 ; 否则 转 (2) 继 续 。 

【 例 11.2】 设 有 5 个 初始 归并 段 ,它们 中 各 记录 的 关键 字 分 别 是 : 

Fu :{(17,21,co) Fi:{5,44,00} F,:{10,12,00} F,:{29,32,00} F,:{15,56,00} 

其 中 ,= 是 段 结束 标志 即 &。。.。 说 明 利 用 败 者 树 进行 5 路 平衡 归并 排序 的 过 程 。 

这 里 &=5, 其 初始 归并 段 的 段 号 分 别 为 0 一 4( 与 F ~~F， 相对 应 )。 先 构造 含有 5 
个 叶子 结 点 的 败 者 树 ,由 于 败 者 树 中 不 存在 单 分 支 结 点 ,所 以 其 中 有 4 个 分 支 结 点 ,再 加 上 
一 个 冠军 结 点 (用 于 存放 最 小 关键 字 )。 用 1s[0] 存 放 冠 军 结 点 ,ls[1] 一 1s[4] 存 放 分 支 结 点 ， 
bo 一 b4 存放 叶子 结 点 。 初 始 时 ls[0] 一 1s[4] 分 别 取 5( 对 应 的 F; 是 虚拟 段 ,只 含 一 个 最 小 关 
键 字 MINKEY 即 一 c) ,加 一 六 分 别 取 Po 一 忆 中 的 第 一 个 关键 字 , 如 图 11.4(a) 所 示 。 为 
了 方便 ,图 11.4 中 的 每 个 分 支 结 点 中 除了 段 号 以 外 另 加 有 相应 的 关键 字 。 

然后 从 b, 一 b。 进行 调整 建立 败 者 树 。 

调整 b , 置 胜 者 *( 关 键 字 最 小 者 ) 为 4, 一 (s 十 5)/2 一 4, 将 0[Ls]. key(15) 和 6b[ls[4]. key] 
(O[ls[4]. key] 三 一 = ) 进 行 比较 , 胜 者 *=1s[ 自 =5, 将 败 者 “4(15)” 放 在 1s[4] 中 ,t=1/2==2; 
将 ls[s].key( 一 co) 与 双亲 结 点 ls[1j. key( 一 co) 进 行 比 较 , 胜 者 仍 为 *=5, 上 一 t/2 王 1; 将 
1s[s]. key( 一 co) 与 双亲 结 点 ls[4J. key( 一 c=) 进 行 比较 , 胜 者 仍 为 *=5, 上 一 凡 2 一 0, 最 后 置 
1s[0]=s( 一 c2)。 其 结果 如 图 11.4(b) 所 示 。 实 际 上 就 是 从 ww 到 1s[1]( 图 11.4(b) 中 的 粗 
线 部 分 ) 进 行 调整 ,将 最 小 关键 字 的 段 号 放 在 lsL0] 中 。 

调整 六 一 和 的 过 程 与 此 类 似 , 它 们 调整 后 得 到 的 结果 分 别 如 图 11.4(c) 一 图 11.4(f) 所 
示 , 图 11.4(f) 就 是 构建 的 初始 败 者 树 。 

在 败 者 树 建 立 好 以 后 ,可 以 利用 5 路 归并 产生 有 序 序列 ,其 中 主要 的 操作 是 从 5 个 关键 
字 中 找 出 最 小 关键 字 并 确定 其 所 在 的 段 号 ,这 对 败 者 树 来 说 十 分 容易 实现 。 

先 从 初始 败 者 树 中 输出 1s[0] 记 录 到 结果 输出 归并 有 段 中 , 即 输出 1 号 段 的 当前 关键 字 为 
5 的 记录 ,然后 在 Fi 中 补充 下 一 个 关键 字 为 44 的 记录 到 11 号 段 ,再 进行 调整 。 调 整 的 过 





程 是 将 新 进入 树 的 叶子 结 点 与 双亲 结 点 进行 比较 , 较 大 者 ( 败 者 ) 存 放 到 双亲 结 点 中 , 较 小 者 ~ 


( 胜 者 ) 与 上 一 级 的 祖先 结 点 再 进行 比较 ,此 过 程 不 断 进 行 一 直到 根 结 点 ,最 后 把 新 的 全 局 优 
胜 者 写 至 输出 归并 有 段 。 

对 于 本 例 ,将 1(5) 写 至 结果 输出 归并 段 后 在 Fi 中 补充 下 一 个 关键 字 为 44 的 记录 , 调 
整 败 者 树 ,即将 1(44) 与 2(10) 进 行 比较 ,产生 败 者 1(44), 放 在 ls[L3] 中 , 胜 者 为 2(10); 将 
2(10) 与 4(15) 进 行 比较 ,产生 败 者 4(15) , 胜 者 为 2(10); 最 后 将 胜 者 2(10) 放 在 1sL0] 中 。 只 
经 过 两 次 比较 产生 新 的 关键 字 最 小 的 记录 2(10) ,如 图 11.5 所 示 ,其 中 粗 线 部 分 为 调整 路 径 。 
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ls[0] 6(-=)》 ls[0] 6G6(--=) 





































































































(e) 从 bi 开始 调整 (f) 从 bo 开始 调整 
图 11.4 建立 败 者 树 的 过 程 


说 明 : 在 上 一 小 节 的 置换 -选择 排序 算法 中 第 (2) 步 从 WA 中 选 出 关键 字 最 小 的 记录 时 
也 可 以 使 用 败 者 树 方法 以 提高 算法 效率 。 
从 上 例 看 到 ,k 路 平衡 归并 的 败 者 树 的 高 度 为 logsk | 十 10, 在 每 次 调整 找 下 一 个 具有 
最 小 关键 字 的 记录 时 仅 需 要 做 [logsk | 次 关键 字 比 较 。 
因此 ,车 初始 归并 有 段 为 m 个 ,利用 败 者 树 在 个 记录 中 选择 最 小 者 只 需要 进行 | logsk | 
次 关键 字 比 较 , 则 := | logu | 趟 归并 总 共 需 要 的 关键 字 比 较 次 数 为 
sX (u—1) Xx[logsk |= [Tlogem |X (u—) Xx[logzk | 


@ 上 路 平衡 归并 败 者 树 是 一 棵 含有 k 个 叶子 结 点 , 且 没 有 单 分 支 结 点 (这 是 构建 路 平衡 归并 败 者 树 的 约定 ) 的 完 
全 二 叉 树 , 即 加 4 二 0。 有 ns 二 no 一 1 二 k 一 1,n 二 no 十 mm 十 nz 一 2k 一 1, 则 hh 二 站 ogz(n 十 1) | 二 门 ogz (2k) | 二 站 ogzk | 十 1。 
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ls[0] (2(10)) 冠军 (最 小 者 ) 
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图 11.5 重 购 后 的 败 者 树 ( 粗 线 部 分 结 点 发 生 改 变 ) 


=[logsm |X (u—1) Xx[logsk |/[logk | 
=|[logsm |X (u—1) 
这 样 ,关键 字 比 较 次 数 与 & 无 关 , 总 的 内 部 归并 时 间 不 会 随 k 的 增 大 而 增 大 。 但 上 越 
大 ,归并 树 的 高 度 较 小 , 读 写 磁盘 的 次 数 也 较 少 。 
因此 , 当 采 用 败 者 树 实现 多 路 平衡 归并 时 ,只 要 内 存 空间 允许 , 增 大 归并 路 数 上 会 有 效 
地 减少 归并 树 的 高 度 , 从 而 减少 读 写 磁盘 次 数 ,提高 外 排序 的 速度 。 


11.24 最 佳 归 并 树 


由 于 采用 置换 -选择 排序 算法 生成 的 初始 归并 段 长 度 不 等 ,在 进行 逐 趟 人 路 归并 时 对 归 
并 段 的 组 合 不 同 ,会 导致 归并 过 程 中 读 写 记录 的 次 数 不 同 。 为 了 提高 归并 的 时 间 效 率 , 我 们 
有 必要 对 各 归并 段 进行 合理 的 搭配 组 合 。 按 照 最 佳 归并 树 的 设计 可 以 使 归并 过 程 中 对 外 存 
的 读 写 次 数 最 少 。 

归并 树 是 描述 归并 过 程 的 上 次 树 。 因 为 每 一 次 做 人 路 归并 都 需要 有 A 个 归并 段 参加 ， 
因此 归并 树 是 只 包含 度 为 0 和 度 为 的 结 点 的 标准 & 次 树 。 

下 面 看 一 个 例子 。 设 有 11 个 长 度 不 等 的 初始 归并 有 段 ,其 长 度 (记录 个 数 ) 分 别 为 1、3、 
5、7、9、13、16、20、24、30、38。 在 对 它们 进行 3 路 归并 时 ,采用 归并 方案 对 应 的 一 棵 归并 树 如 
图 11.6 所 示 。 

此 归并 树 的 带 权 路 径 长 度 WPL=(24 十 30 十 38 十 13 十 16 十 20) X4 十 9X3 十 (5 十 7)X 
2 十 (1 十 3) X1=619。 

因为 在 归并 树 中 各 叶子 结 点 代表 参加 归并 的 各 初始 归并 段 , 叶 子 结 点 上 的 权 值 即 为 该 
初始 归并 段 中 的 记录 个 数 , 根 结 点 代表 最 终生 成 的 归并 段 ,叶子 结 点 到 根 结 点 的 路 径 长 度 表 
示 在 归并 过 程 中 的 读 记 录 次 数 , 各 非 叶子 结 点 代表 归并 出 来 的 新 归并 段 , 则 
归并 树 的 带 权 路 径 长 度 WPL 即 为 归并 过 程 中 的 总 读 记录 数 ,因此 在 归并 
过 程 中 总 的 读 写 记录 次 数 为 2XWPL 二 1238。 

不 同 的 归并 方案 所 对 应 的 归并 树 的 带 权 路 径 长 度 各 不 相同 ,为 了 使 总 加 3 
的 读 写 次 数 达到 最 少 ,需要 改变 归并 方案 ,重新 组 织 归 并 树 ,使 其 路 径 长 度 视频 讲解 
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图 11.6 一 棵 3 路 归并 树 


WPL 尽 可 能 短 。 所 有 归并 树 中 最 小 带 权 路 径 长 度 WPL 的 归并 树 称 为 最 佳 归 并 树 (optimal 
merge tree) 。 为 此 ,可 将 哈 夫 曼 树 的 思想 扩充 到 & 次 树 的 情形 。 在 归并 树 中 ,让 记录 个 数 少 
的 初始 归并 段 最 先 归 并 ,记录 个 数 多 的 初始 归并 段 最 晚 归 并 ,就 可 以 建立 总 的 读 写 次 数 达到 
最 少 的 最 佳 归并 树 。 显 然 图 11. 6 所 示 的 归并 树 不 是 一 棵 最 佳 归并 树 。 

为 了 使 归并 树 成 为 一 棵 标准 次 树 , 可 能 需要 补 入 虚 段 (记录 个 数 为 0 的 归并 段 ) 。 

补 虚 段 的 原则 为 : 设 参 加 归并 的 初始 归并 段 有 mm 个 ,做 路 平衡 归并 。 因 为 归并 树 
是 只 有 度 为 0 和 度 为 k 的 结 点 的 正则 k 次 树 , 设 度 为 0 的 结 点 有 mm 个 (因为 初始 归并 段 有 
mm 个 ,对 应 归并 树 的 叶子 结 点 就 有 m 个 ), 度 为 k 的 结 点 有 wm 个, 则 有 m=(k 一 1)m 十 1。 
因此 ,可 以 得 出 a 二 (Cm 一 1)/(k 一 1)。 如 果 该 除 式 能 整除 , 即 (m 一 1) mod (一 1) 三 0, 则 
说 明 这 m 个 叶子 结 点 正好 可 以 构造 & 次 归并 树 , 不 需 加 虚 段 ,此 时 分 支 结 点 有 ms 个 。 如 果 
(mm 一 1)%(k 一 1) 二 wu 去 0, 则 需要 补 入 k 一 u 一 1 个 虚 段 ,这 样 就 可 以 建立 归并 树 了 。 

因此 ,最 佳 归并 树 是 带 权 路 径 长 度 最 短 的 次 ( 阶 ) 喻 夫 曼 树 ,其 构造 步骤 如 下 : 

(1) 车 Gm 一 1)mod(k 一 1) 取 0, 则 需 附 加 (4 一 上) 一 Gm 一 1)mod(k 一 1) 个 长 度 为 0 的 虚 段 
(dummy run) ,以 使 每 次 归并 都 可 以 对 应 人 个 段 。 

(2) 按照 哈 夫 曼 树 的 构造 原则 ( 权 值 越 小 的 结 点 离 根 结 点 越 远 ) 构 造 最 佳 归并 树 。 

对 于 前 面 的 例子 ,m= 二 11,k 二 3,(11 一 1)mod(3 一 1) 二 0, 可 以 不 加 空 归并 段 ,直接 进行 3 
路 归并 ,其 最 佳 归并 树 如 图 11.7 所 示 。 
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图 11.7 一 棵 3 路 最 佳 归并 树 
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此 归并 树 的 带 权 路 径 长 度 WPL=38X1 十 (13 十 16 十 20 十 24 十 30) X2 十 (7 十 9) X3 十 
(1 十 3 十 5) X4 王 328, 在 归并 过 程 中 总 的 读 写 记 录 次 数 为 2X WPL 二 656。 

也 就 是 说 ,同样 一 组 初始 归并 段 , 采 用 的 归并 路 数 也 相同 ,但 选择 不 同 的 归并 方案 , 读 写 
记录 次 数 可 能 是 不 相同 的 ,最 佳 归 并 树 对 应 的 归并 方案 是 读 写 记录 次 数 最 少 的 。 

【 例 11.3】 设 文件 经 预 处 理 后 得 到 长 度 分 别 为 49、9、35、18、4、12、23、7、21、14 和 26 
的 11 个 初始 归并 段 , 试 为 4 路 归并 设计 一 个 读 写 文件 次 数 最 少 的 归并 方案 。 

国 初始 归并 有 段 的 个 数 记 =11, 归 并 路 数 & 一 4, 由 于 (m 一 1)mod(R 一 1) 王 1, 不 为 0, 因 
此 需 附 加 (一 上 D 一 (m 一 1)mod(k 一 1) 二 2 个 长 度 为 0 的 虚 段 。 根 据 集 合 {49,9,35,18,4， 
12,23,7,21,14,26,0,0} 得 到 按 长 度 递增 排序 的 结果 为 (0,0,4,7,9,12,14,18,21,23,26， 
35,49) ,由 此 构造 的 4 阶 哈 夫 曼 树 如 图 11. 8 所 示 。 




















图 11.8 4 路 最 佳 归并 树 示例 


该 最 佳 归并 树 显示 了 读 写 记录 次 数 最 少 的 归并 方案 , 即 : 

@ 将 长 度 为 4 和 7 的 初始 归并 段 归并 为 长 度 为 11 的 有 序 段 。 

@ 将 长 度 为 9.12 和 14 的 初始 归并 段 以 及 长 度 为 11 的 有 序 段 归 并 为 长 度 为 46 的 有 
序 段 。 
@ 将 长 度 为 18、21、23 和 26 的 初始 归并 段 归并 为 长 度 为 88 的 有 序 段 。 

@ 最 终 将 长 度 为 35 和 49 的 初始 归并 段 以 及 长 度 为 46 和 88 的 有 序 段 归并 为 记录 长 
度 为 218 的 有 序 文 件 整体 。 

此 归并 方案 的 读 写 记 录 次 数 为 2X[(4 十 7)X3 十 (9 十 12 十 14 十 18 十 21 十 23 十 26) X 2 十 

(35 十 49) X1]=726 次 。 


二 一 


由 于 磁带 的 特性 不 同 于 磁盘 的 特性 ,所 以 两 者 采用 的 外 排序 方法 也 不 尽 相 同 。 


11.31 多 路 平衡 归并 排序 
磁带 的 多 路 平衡 归并 排序 过 程 与 磁盘 的 多 路 平衡 归并 排序 过 程 基 本 上 相同 , 先 对 输入 
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文件 的 各 段 进行 内 排序 ,生成 初始 归并 段 ,再 把 它们 写 到 磁带 上 ,然后 再 把 这 些 归并 段 进 行 
反复 归并 ,直到 只 剩 下 一 个 归并 段 ( 即 为 排 好 序 的 文件 ) 为 止 。 

磁带 排序 (tape sort) 和 磁盘 排序 的 主要 不 同 之 处 在 于 磁带 排序 需要 充分 考虑 归并 段 的 
分 布 状况 ,因为 磁带 是 顺序 存 取 的 ,所 以 各 归并 段 分 布 在 不 同 磁带 和 同一 磁带 的 不 同位 置 对 
排序 效率 影响 极 大 。 

先 看 一 个 二 路 归并 磁带 排序 的 例子 ,了 解 磁 带 排序 所 涉及 的 各 种 因素 。 

设 有 一 个 文件 包含 4500 个 记录 ,现在 要 对 其 进行 排序 ,可 供 使 用 的 磁带 有 4 台 , 即 T)、 
Ts 、T;、T, ,可 供 排 序 用 的 内 存 空 间 包 含 存放 750 个 记录 的 空间 以 及 一 些 必要 的 工作 区 。 设 
内 、 外 存 交换 的 块 的 大 小 为 250 个 记录 。 为 了 简化 讨论 ,假设 初始 归并 段 中 的 生成 是 采用 通 
常 的 内 排序 方法 实现 的 。 这 样 ,一 次 可 读 入 3 个 输入 文件 的 物理 块 ,对 之 进行 排序 ,并 作为 
一 个 归并 段 输 出 。 下 面 采 用 二 路 归并 的 方法 来 实现 归并 段 的 归并 ,因而 使 用 两 个 输入 缓冲 
区 和 一 个 输出 缓冲 区 ,每 个 缓冲 区 的 大 小 为 250 个 记录 。 排 序 过 程 的 具体 步骤 如 下 (假设 输 
入 文件 在 磁带 T， 上): 

第 1 步 : 把 输入 文件 分 段 ( 每 段 包 含 750 个 记录 ) 读 入 
内 存 并 进行 内 排序 ,生成 初始 归并 段 ,然后 将 这 些 归并 有 段 轮 
流 写 到 磁带 T, 和 T 上 。 此 步骤 后 的 磁带 状况 如 图 11. 9(a) 明 并 段 2 | 归并 段 4 | 归并 上段 6 | 

第 2 步 , 采用 二 路 归并 ,把 六 上 的 各 归并 段 与 T 上 0 
的 各 归并 有 段 归并 (之 后 六 和 T 上 的 记录 仍 存在 ,但 不 再 
有 用 ,可 将 它们 看 成 空 磁带 ) ,并 把 所 产生 的 较 大 归并 段 轮 
流 分 布 到 T， 和 Ti 上 ( 若 输入 文件 带 需 要 保留 , 则 在 第 1 
步 完 成 后 把 输入 文件 带 从 T， 上 和 印 下 来 , 换 上 工作 带 )。 此 ”下 | 归并 段 2 | 归并 段 4 | 归并 段 6 
步 后 的 磁带 状况 如 图 11. 9(b) 所 示 。 其 中 Ts 上 的 归并 段 1 六 | 归并 段 1 归并 段 3 
是 Ti 上 的 归并 段 1 和 T 上 的 归并 段 2 归并 的 结果 ,Ts 上 a 
的 归并 有 段 3 是 Ti 上 的 归并 段 5 和 T。 上 的 归并 有 段 6 归 并 的 “一 一 一 一 一 - 
结果 ,T， 上 的 归并 段 2 是 T 上 的 归并 眉 3 和 T 上 的 归并 人 


民生 的 全 洒 | 归并 段 1( 包 含 3000 个 记录 ) 
第 3 步 : 把 三 上 的 归并 段 1 和 全 上 的 归并 段 2 进行 


归并 ,并 将 结果 放 到 T, 上 。 此 步 后 的 磁带 状况 如 图 11.9(c) 码 归并 段 3 | 
所 示 。 (0) 第 3 步 后 磁带 的 状态 

第 4 步 : 把 Ti 上 的 归并 段 1 和 Ts 上 的 归并 段 3 归 图 11.9 磁带 排序 过 程 
并 ,并 把 结果 放 到 T: 上 ,这 就 是 排 好 序 的 文件 。 

这 里 采用 的 是 二 路 归并 ,和 磁盘 排序 的 情况 一 样 ,排序 的 时 间 主 要 取决 于 对 数据 的 扫描 
遍 数 。 采 用 多 路 归并 能 够 减少 扫描 的 遍 数 ,但 对 磁带 排序 来 说 ,多 路 归并 需要 多 台 磁 带 ,为 
了 避免 过 多 的 磁带 寻找 时 间 , 要 归并 的 归并 段 需 要 放 在 不 同 的 磁带 上 。 短 - 和 
此 ,路 归并 至 少 需要 & 十 1 台 磁 带 ,其 中 & 台 作为 输入 带 , 另 一 台 为 归并 后 
输出 之 用 。 但 是 这 样 需要 对 输出 带 再 做 一 遍 扫描 ,把 输出 带 上 的 各 归并 段 
重新 分 配 到 台 磁 带 上 ,以 便 作为 下 一 级 归并 使 用 。 若 使 用 2k 台 磁 带 , 则 
可 避免 这 种 再 分 配 扫描 。 把 & 台 作为 输入 带 , 其 余 & 台 作为 输出 带 ,在 下 一 视 新 计 时 
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级 归并 时 输入 带 与 输出 带 的 作用 互相 对 换 。 
上 述 例子 就 是 用 4 台 磁 带 实现 二 路 归并 .TT、T, 和 T,、T 轮流 地 用 作 输 入 带 和 输出 带 。 


11.32 多 阶段 归并 排序 


所 谓 的 多 阶段 归并 排序 实际 上 是 多 路 非 平衡 归并 排序 , 即 各 条 带 上 的 归并 段 不 再 保持 
平衡 分 布 , 它 在 & 路 归并 中 仅 使 用 (十 1) 条 磁带 就 可 避免 在 多 路 平衡 归并 排序 法 中 遇 到 的 
重新 分 布 有 序 段 的 问题 。 

开始 时 ,初始 归并 段 不 平衡 地 分 配 在 前 & 条 磁带 上 ,第 (十 1) 条 磁带 作为 输出 带 ,开始 
为 空 。 每 一 步 归 并 只 是 部 分 记录 参加 ,归并 段 最 少 的 带 在 本 步 归并 完成 后 便 成 为 空 带 , 作 为 
下 一 步 归并 的 输出 带 。 这 样 , (4 十 1) 条 磁带 将 轮流 成 为 输出 带 , 直 到 整个 文件 为 一 个 排序 文 
件 为 止 。 

例如 ,假设 有 17 个 初始 归并 有 段 (Si ,S;,…,Si), 用 4 台 磁 带 机 Ti 、T;、Ts 和 TT 做 3 路 多 
阶段 归并 排序 ,其 初始 归并 有 段 的 分 布 情况 及 排序 过 程 中 各 磁带 数据 的 变化 情况 如 表 11. 2 所 示 。 


表 11.2 各 阶段 归并 段 的 分 布 情况 





阶 国 第 2 步 | 第 3 步 | 第 4 步 
磁带 税 如 时 和 | 归并 后 | 归并 后 归并 后 
T S1,S4,S7, Si ,S13 ,Ss ,Sr S13,S1s ,Si Sy 空 S( 最 终结 果 ) 
T: Sa ,Si ,Ss ,Su ,Su Si Su ,Sis 空 Se 空 
T, Ss ,Se ,So ,Si 空 SP ,SS Si 空 
色 | 普 Si ,SP ,SH ,Si | Si ,SP St 空 





为 了 使 归并 的 趟 数 达到 最 少 ,必须 合理 地 分 配 各 磁带 上 初始 归并 段 的 段 数 。 通 过 分 析 
可 以 得 出 以 下 结论 : 归并 段 的 总 数 以 及 在 各 带 上 的 分 布 情况 与 A 阶 Fibonacci( 斐 波 那 契 ) 序 
列 有 关系 。 设 Fw 为 k 阶 Fibonacci 序列 中 的 第 i 项 , 当 利 用 (k 十 1) 台 磁带 机 做 路 多 阶段 
归并 时 , 若 初始 归并 段 的 总 数 为 : 
T= [kF® + (ko DFS + +2F s+ Fy] 
则 需要 进行 (i 一 k 十 2) 个 阶段 的 归并 ,初始 归并 自在 各 带 上 分 布 的 段 数 应 为 : 
Ti = FD 二 FR 二 十 Fz 十 Fe 习 - 扫 





Ts = FY 二 FS 十 … 十 Fy 








Ti = FY + FS oa 
视频 讲解 





到 一 Fe 
其 中 ,k 阶 Fibonacci 数列 可 用 下 面 的 递 推 公式 导出 : | 
= P= =P=0 
PS 


FY = FS +FS 二 +… 十 FS 
例如 ,假设 在 4 台 磁 带 机 上 做 3 路 多 阶段 归并 时 ,初始 归并 段 的 段 数 为 193, 则 首先 根 
据 定义 可 以 计算 出 三 阶 广义 Fibonacci 序列 为 (0,0,1,1,2,4.7,13,24,44,81,149,274,…)， 
而 T=3FS2 十 2F8 十 Ff2 一 3X44 十 2X24 十 13 一 193, 即 ;一 9, 所 以 各 磁带 上 的 初始 归并 段 
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段 数 分 别 为 : 
Ti 三 F9P 十 Fe 十 FP = 44 二 24 十 13 = 81 
Ts = FY 十 F8) = 44+24= 68 
二 二: 漆 
和 
一 共 需 要 进行 (i 一 k 十 2) 二 8 个 阶段 的 归并 ,其 各 阶段 中 归并 有 段 段 数 在 各 磁带 机 上 的 分 
布 情况 如 表 11. 3 所 示 。 


表 11.3 四 带 三 路 归并 各 阶段 中 归并 段 的 段 数 分 布 情况 








阶段 号 T TT 态 T, 归并 段 总 数 
初始 81 68 44 0 193 
1 37 24 0 44 105 
2 13 0 24 20 57 
和 0 13 11 入 31 
4 入 6 4 0 17 
5 3 2 0 4 9 
6 | 0 2 2 5 
7 0 1 1 1 3 
8 0 0 0 1 


本 章 的 基本 学 习 要 点 如 下 : 

(1) 理解 外 排序 的 特点 。 

(2) 掌握 磁盘 排序 过 程 和 影响 磁盘 排序 性 能 的 因素 。 
(3) 掌握 生成 初始 归并 段 的 置换 -选择 排序 算法 。 加 站 
(4) 掌握 利用 败 者 树 实现 多 路 平衡 归并 的 过 程 和 特点 。 视频 讲解 
(5) 掌握 利用 最 佳 归 并 树 构造 归并 方案 的 过 程 。 

(6) 理解 磁带 排序 过 程 。 


























1. 外 排序 中 两 个 相对 独立 的 阶段 是 什么 ? 

2. 给 出 一 组 关键 字 T={12,2,16,30,8,28,4,10,20,6,18} , 设 内 存 工作 区 可 容纳 4 个 
记录 ,给 出 用 置换 -选择 排序 算法 得 到 的 全 部 初始 归并 段 。 

3. 设 输入 的 关键 字 满足 局 二 心 过 … 二 心 , 缓 冲 区 大 小 为 闷 , 用 置换 -选择 排序 方法 可 产 
生 多 少 个 初始 归并 段 ? 

4. 什么 是 多 路 平衡 归并 ? 多 路 平衡 归并 的 目的 是 什么 ? 
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5. 什么 是 败 者 树 ? 其 主要 作用 是 什么 ? 用 于 kk 路 归并 的 败 者 树 中 共有 多 少 个 结 点 (不 
计 和 冠军 结 点 )? 

6. 如 果 某 个 文件 经 内 排序 得 到 80 个 初始 归并 段 ,试问 : 

(1) 若 使 用 多 路 平衡 归并 执行 3 趟 完成 排序 ,那么 应 取 的 归并 路 数 至 少 应 为 多 少 ? 

(2) 如 果 操 作 系统 要 求 一 个 程序 同时 可 用 的 输入 /输出 文件 的 总 数 不 超过 15 个 , 则 按 
多 路 平衡 归并 至 少 需要 几 趟 可 以 完成 排序 ? 如 果 限 定 这 个 趟 数 ,可 取 的 最 低 路 数 是 多 少 ? 

7. 若 采用 置换 选择 排序 算法 得 到 8 个 初始 归并 段 ,它们 的 记录 个 数 分 别 为 37 .34、300、 
41、70、120、35 和 43。 夯 出 这 些 磁盘 文件 进行 归并 的 4 阶 最 佳 归 并 树 , 计 算出 总 的 读 写 记 
录 数 。 





一 人 -上 机 实验 题 11 一 一 


期 验 证 性 实验 

实验 题 1: 创建 一 棵 败 者 树 

目的 : 领会 外 排序 中 败 者 树 的 创建 过 程 和 算法 设计 。 

内 容 : 编写 一 个 程序 exp11-1. cpp, 给 定 关键 字 序 列 (17,5,10,29,15), 采 用 5 路 归并 ， 
创建 对 应 的 一 棵 败 者 树 ,并 输出 构建 过 程 。 
慌 设 计 性 实验 

实验 题 2: 从 大 数据 文件 中 挑选 K 个 最 小 的 记录 

目的 : 掌握 外 排序 的 过 程 及 堆 的 应 用 算法 设计 。 

内 容 : 编写 一 个 程序 exp11-2. cpp, 从 大 数据 文件 中 挑选 K 个 最 小 的 记录 。 假 设 内 存 
工作 区 的 大 小 为 ,模拟 这 个 过 程 ,并 输出 每 趟 的 结果 。 假 设 整数 序列 为 (15,4,97,64,17， 
32,108,44,76,9,39,82,56,31,80,73,255,68) ,从 中 挑选 5 个 最 小 的 整数 。 


实验 题 3: 用 败 者 树 实现 置换 -选择 算法 
目的 : 领会 外 排序 中 置换 -选择 算法 的 执行 过 程 和 算法 设计 。 
内 容 : 编写 一 个 程序 exp11-3. cpp, 模 拟 置换 -选择 算法 生成 初始 归并 段 的 过 程 以 求解 
以 下 问题 。 设 磁盘 文件 中 共有 18 个 记录 ,记录 的 关键 字 序列 为 
(15,4,97,64,17,32,108,44,76,9,39,82,56,31,80,73,255 ,68) 
若 内 存 工 作 区 可 容纳 5 个 记录 ,用 置换 -选择 排序 可 产生 几 个 初始 归并 段 , 每 个 初始 归 
并 段 包 含 哪些 记录 ? 假设 输入 文件 数据 和 输出 归并 段 数据 均 存 放 在 内 存 中 。 


实验 题 4: 实现 多 路 平衡 归并 算法 





目的 : 领会 外 排序 中 多 路 平衡 归并 的 执行 过 程 和 算法 设计 。 


内 容 : 编写 一 个 程序 exp11-4. cpp ,模拟 利用 败 者 树 实现 5 路 归并 算法 的 过 程 以 求解 以 
下 问题 。 设 有 5 个 文件 中 的 记录 关键 字 如 下 : 
Fo:{17,21,00} Fi:{5,44,0°0} F,:{10,12,c0} Fs:{29,32,00} Fe:{15,56,co)} 
要 求 将 其 归并 为 一 个 有 序 段 并 输出 。 假 设 这 些 输入 文件 数据 存放 在 内 存 中 ,输出 结果 
直接 在 屏幕 上 显示 。 
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在 处 理 数据 时 经 常 需要 将 大 量 的 数据 以 文件 方式 保存 在 外 存 
中 , 如 何在 文件 中 有 效 地 组 织 数据 是 高 效 使 用 数据 的 关键 。 
本 章 介绍 文件 的 基本 概念 和 各 种 文件 的 存储 结构 。 
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文件 的 基本 概念 


1211 什么 是 文件 


文件 (file) 是 性 质 相 同 的 记录 的 集合 。 文 件 的 数据 量 通常 很 大 , 它 被 放置 在 外 存 上 。 数 据 
结构 中 所 讨论 的 文件 主要 是 数据 库 意 义 上 的 文件 ,而 不 是 操作 系统 意义 上 的 文件 。 操 作 系 统 
中 研究 的 文件 是 一 维 的 无 结构 连续 字符 序列 ,数据 库 中 所 研究 的 文件 是 带 有 结构 的 记录 集合 
每 个 记录 可 由 若干 个 数据 项 构成 。 记 录 是 文件 中 存 取 的 基本 单位 ,数据 项 是 文件 可 使 用 的 最 
小 单位 。 数 据 项 有 时 也 称 为 字段 。 其 值 能 唯一 标识 一 个 记录 的 数据 项 或 数据 项 的 组 合 称 为 主 
关键 字 (primary key) ,其 他 不 能 唯一 标识 一 个 记录 的 数据 项 则 称 为 次 关键 字 (secondary key) 。 

图 12. 1 所 示 为 一 个 简单 的 学 生 文件 ,每 个 学 生 情况 是 一 个 记录 , 它 由 5 个 数据 项 组 成 。 
其 中 “学 号 ”可 作为 主 关键 字 , 它 能 唯一 标识 一 个 记录 ,而 姓名 、 性 别 等 数据 只 能 作为 次 关键 
字 , 因 为 它们 的 值 对 不 同 的 记录 是 可 以 相同 的 。 


| 


一 ”TW 
醉酒 醒 工本 正本 


本 
| 4 | aw [|| mw | se 


图 12.1 一 个 学 生 文 件 








文件 可 以 按照 记录 中 关键 字 的 多 少 分 成 单 关键 字 文 件 和 多 关键 字 文件 。 若 文件 中 的 记 
录 只 有 一 个 唯一 标识 记录 的 主 关键 字 , 则 称 其 为 单 关键 字 文件 ; 若 文件 中 的 记录 除了 含有 
一 个 主 关键 字 以 外 还 含有 若干 个 次 关键 字 , 则 称 为 多 关键 字 文件 。 

文件 又 可 分 成 定 长 文件 和 不 定 长 文件 。 若 文件 中 记录 含有 的 信息 长 度 相同 , 则 称 这 类 
记录 为 定 长 记录 ,由 这 种 定 长 记录 组 成 的 文件 称 为 定 长 文件 ; 若 文件 中 记录 含有 的 信息 长 
度 不 等 , 则 称 为 不 定 长 文件 。 图 12. 1 所 示 的 学 生 文件 是 一 个 定 长 文件 。 

和 其 他 数据 结构 一 样 ,文件 结构 也 包括 逻辑 结构 存储 结 构 以 及 在 文件 上 的 各 种 操作 
(运算 ) 这 3 个 方面 。 文 件 的 操作 是 定义 在 逻辑 结构 上 的 ,但 操作 的 具体 实现 要 在 存储 结构 
上 进行 。 


1212 文件 的 逻辑 结构 及 操作 


文件 中 各 记录 之 间 存 在 着 逻辑 关系 , 当 一 个 文件 的 各 个 记录 按照 某 种 次 序 排列 起 来 时 
(这 种 排列 的 次 序 可 以 是 记录 中 关键 字 的 大 小 ,也 可 以 是 各 个 记录 存 入 该 文件 的 时 间 先 后 
等 ) 各 记录 之 间 就 自然 地 形成 了 一 种 线性 关系 。 在 这 种 次 序 下 ,文件 中 的 每 个 记录 最 多 只 有 
一 个 后 继 记 录 和 一 个 前 驱 记 录 , 而 文件 的 第 一 个 记录 只 有 后 继 没有 前 驱 ,文件 的 最 后 一 个 记 
录 只 有 前 驱 没 有 后 继 。 因 此 ,文件 可 看 成 是 一 种 线性 结构 。 
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文件 上 的 操作 主要 有 两 类 : 检索 和 维护 。 

文件 检索 就 是 在 文件 中 查找 满足 给 定 条 件 的 记录 , 它 既 可 以 按 记 录 的 多 辑 号 ( 即 记录 存 
入 文件 时 的 顺序 编号 ) 查 找 ,也 可 以 按 关键 字 查 找 。 

文件 维护 主要 是 指 对 文件 进行 记录 的 插入 、 删 除 及 修改 等 更 新 操作 。 此 外 ,为 了 提高 文 
件 的 效率 ,还 要 进行 再 组 织 操作 文件 被 破坏 后 的 恢复 操作 ,以 及 文件 中 数据 的 安全 保护 等 。 


1213 文件 的 存储 结构 


文件 的 存储 结构 是 指 文件 在 外 存 上 的 组 织 方式 。 采 用 不 同 的 组 织 方式 就 得 到 了 不 同 的 
存储 结构 。 基 本 的 组 织 方式 有 4 种 , 即 顺 序 组 织 .索引 组 织 、 哈 希 组 织 和 链 式 组 织 。 文 件 组 
织 的 各 种 方式 往往 是 这 4 种 基本 方式 的 结合 。 

由 于 文件 组 织 方式 ( 即 存储 结构 ) 的 重要 性 ,通常 对 以 不 同方 式 组 织 的 文件 给 予 不 同 的 
名 称 。 目 前 文件 的 组 织 方式 有 很 多 ,人 们 对 文件 组 织 的 分 类 也 不 尽 相同 ,本 章 仅 介绍 几 种 常 
用 的 文件 组 织 方式 , 即 顺序 文件 .索引 文件 、 哈 希 文件 和 多 关键 字 文 件 。 选 择 哪 一 种 文件 组 
织 方式 取决 于 对 文件 中 记录 的 使 用 方式 和 频繁 程度 、 存 取 要 求 、 外 存 的 性 质 和 容量 。 


顺序 文件 (sequential file) 是 指 按 记录 进入 文件 的 先后 顺序 存放 、 其 逻辑 顺序 跟 物 理 顺 
序 一 致 的 文件 。 若 顺序 文件 中 的 记录 按 其 主 关键 字 有 序 , 则 称 此 顺序 文件 为 顺序 有 序 文件 ， 
否则 称 为 顺序 无 序 文件 。 为 了 提高 检索 效率 ,经 常 将 顺序 文件 组 织 成 有 序 文件 。 

一 切 存储 在 顺序 存 取 存储 器 (如 磁带 ) 上 的 文件 都 只 能 是 顺序 文件 。 顺 序 文件 只 能 按 顺 
序 查 找 法 存 取 , 即 顺 序 扫描 文件 , 按 记 录 的 主 关 键 字 逐 个 查找 。 如 果 要 检索 第 i 个 记录 , 必 
须 检索 前 i 一 1 个 记录 。 这 种 查找 法 对 于 少量 的 检索 是 不 经 济 的 ,但 适合 于 批量 检索 , 即 把 
用 户 的 检索 要 求 先进 行 积累 ,一 旦 待 查 记录 聚集 到 一 定数 量 之 后 便 把 这 批 记录 按 主 关键 字 
排序 ,然后 通过 一 次 顺序 扫描 文件 来 完成 这 一 批 检索 要 求 。 

存储 在 直接 存 取 存储 器 (如 磁盘 ) 上 的 顺序 文件 可 以 用 顺序 查找 法 存 取 ,也 可 以 用 分 块 
查找 法 或 二 分 查找 法 进行 存 取 。 分 块 查找 法 在 查找 时 不 必 扫 描 整 个 文件 中 的 记录 , 先 通过 
关键 字 找到 相应 的 块 ,再 扫描 这 个 块 即 可 。 二 分 查找 法 只 能 对 较 小 的 文件 或 一 个 文件 的 索 
引进 行 查找 , 当 文 件 很 大 ,在 磁盘 上 占有 多 个 柱 面 时 ,二 分 查找 将 引起 磁头 来 回 移 动 ,增加 寻 
查 时 间 。 

顺序 文件 不 能 按 顺 序 表 那样 的 方法 进行 插入 、 删 除 和 修改 ( 若 修改 主 关键 字 , 则 相当 于 
BE 先 做 删除 后 做 插入 ) ,因为 文件 中 的 记录 不 能 像 向 量 空间 的 数据 那样 “移动 ”, 而 只 能 通过 复 
制 整个 文件 的 方法 实现 上 述 更 新 操作 。 这 就 是 为 什么 数据 库 系 统 总 会 产生 很 多 临时 文件 的 
原因 。 

顺序 文件 的 主要 优点 是 连续 存 取 的 速度 较 快 , 即 车 文件 中 第 i 个 记录 刚 被 存 取 过 ,而 下 
一 个 要 存 取 的 是 第 ;十 1 个 记录 , 则 这 种 存 取 将 会 很 快 完 成 。 当 顺序 文件 存放 在 单一 存储 设 
备 ( 如 磁带 ) 上 时 ,这 个 优点 总 是 可 以 保持 的 ,而 当 它 是 存放 在 多 路 存储 设备 (如 磁盘 ) 上 时 ， 
在 多 道 程序 的 情况 下 ,由 于 其 他 用 户 可 能 驱使 磁头 移 向 其 他 柱 面 ,就 会 降低 这 一 优点 。 





AZ 文 件 | 


此 ,顺序 文件 多 用 于 磁带 。 


在 用 索引 的 方法 组 织 文件 时 通常 是 在 文件 本 身 ( 称 为 主 文件 ) 之 外 另外 建立 一 张 表 , 它 
指明 逻辑 记录 和 物理 记录 之 间 的 一 一 对 应 关系 ,这 张 表 就 称 为 索引 表 (index table) , 它 和 主 
文件 一 起 构成 的 文件 称 为 索引 文件 (indexed file) 。 

索引 表 中 的 每 一 项 称 为 索引 项 (index item) ,一 般 索引 项 都 是 由 主 关键 字 和 该 关键 字 所 
在 记录 的 物理 地 址 组 成 的 。 显 然 ,索引 表 必 须 按 主 关键 字 有 序 ,而 主 文 件 本 身 则 可 以 按 主 关 
键 字 有 序 或 无 序 , 如 果 主 文件 有 序 称 为 索引 顺序 文件 (indexed sequential file) ,如 果 主 文件 
无 序 称 为 索引 非 顺 序 文 件 (indexed non-sequential file) 。 

对 于 索引 非 顺序 文件 ,由 于 主 文件 中 的 记录 是 无 序 的 , 则 必须 为 每 个 记录 建立 一 个 索引 
项 ,这 样 建立 的 索引 表 称 为 稠密 索引 。 对 于 索引 顺序 文件 ,由 于 主 文件 中 的 记录 按 关键 字 有 
序 , 则 可 对 一 组 记录 建立 一 个 索引 项 ,例如 让 文件 中 的 每 个 物理 块 对 应 一 个 索引 项 ,这 种 索 
引 表 称 为 稀 疏 索引 。 通 常 将 索引 非 顺序 文件 简称 为 索引 文件 ,本 节 只 讨论 这 种 文件 。 

索引 文件 在 存储 器 上 分 为 两 个 区 , 即 索引 区 和 数据 区 ,前 者 存放 索引 表 , 后 者 存放 主 文 
件 。 在 建立 文件 的 过 程 中 按 输入 记录 的 先后 次 序 建立 数据 区 和 索引 表 , 这 样 的 索引 表 其 关 
键 字 是 无 序 的 , 待 全 部 记录 输入 完毕 后 再 对 索引 表 进 行 排序 ,排序 后 的 索引 表 和 主 文件 一 起 
就 形成 了 索引 文件 。 

例如 ,对 于 图 12. 2(a) 所 示 的 数据 文件 (假设 物理 地 址 编号 从 1 开始 ) , 主 关键 字 是 学 
号 ; 排序 前 的 索引 表 如 图 12. 2(b) 所 示 ( 假 设 物理 地 址 编号 从 10 开始 ); 排序 后 的 索引 表 如 
图 12. 2(c) 所 示 ( 假 设 物理 地 址 编号 从 10 开始 )。 图 12. 2(a) 和 图 12. 2(c) 一 起 形成 了 一 个 
索引 文件 。 













































































物理 地 址 | 学 号 | 姓名 | 其 他 物理 地 址 | 关键 字 | 物理 地 址 物理 地 址 | 关键 字 | 物理 地 址 
1 李 明 10 l 1 10 1 1 
2| 5 | 于 平 | | 11 5 2 11 a 3 
3| 3 张 萍 12 3 3 12 4 5 
4| 8 陈强 13 本 4 13 5 加 
5| 4 | 马 伟 14 4 5 14 8 4 
(a) 数据 文件 (b) 排序 前 的 索引 区 (c) 排序 后 的 索引 区 


图 12.2 索引 文件 示例 





检索 分 两 步 进行 , 首 先 将 外 存 上 含有 索引 区 的 物理 块 送 入 内 存 , 查 找 所 需 记录 的 物理 地 aa 


址 ,然后 再 将 含有 该 记录 的 物理 块 送 入 内 存 。 若 索引 表 不 大 , 则 可 将 索引 表 一 次 读 人 内 存 ， 
因此 在 索引 文件 中 进行 检索 只 需 两 次 访问 外 存 , 即 一 次 读 索 引 、 一 次 读 记 
录 。 由 于 索引 表 是 有 序 的 ,所 以 对 索引 表 的 查找 可 用 顺序 查找 或 二 分 查找 
等 方法 。 

索引 文件 的 更 新 操作 也 很 简单 。 在 插入 时 将 插入 记录 置 于 数据 区 的 末 
尾 , 并 在 索引 表 中 插入 索引 项 ; 在 删除 时 删 去 相应 的 索引 项 ; 若 要 修改 主 关 
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键 字 , 则 必须 同时 修改 索引 表 。 

当 记录 数目 很 大 时 ,索引 表 也 很 大 ,以 至 于 一 个 物理 块 容纳 不 下 。 在 这 种 情况 下 查阅 索 
引 仍 要 多 次 访问 外 存 。 为 此 可 以 对 索引 表 建 立 一 个 索引 , 称 为 查找 表 。 

上 节 介 绍 的 索引 非 顺序 文件 适合 于 随机 存 取 , 这 是 由 于 主 文件 是 无 序 的 ,顺序 存 取 将 会 
频繁 地 引起 磁头 移动 ,因此 索引 非 顺序 文件 不 适合 于 顺序 存 取 。 而 索引 顺序 文件 的 主 文件 
也 是 有 序 的 ,所 以 它 既 适合 于 随机 存 取 , 也 适合 于 顺序 存 取 。 另 外 ,索引 顺序 文件 由 于 主 文 
件 是 按 主 关键 字 有 序 的 ,因此 索引 表 采 取 稀 朴 索 引 , 占 用 的 空间 较 少 。 它 是 常用 的 一 种 文件 
组 织 结构 。 本 节 将 介绍 两 种 最 常用 的 索引 顺序 文件 , 即 ISAM 文件 和 VSAM 文件 。 


1231 ISAM 文 件 


ISAM 是 索引 顺序 存 取 方法 (indexed sequential access method) 的 英文 缩写 。ISAM 文 
件 是 一 种 采用 静态 索引 结构 的 磁盘 存 取 文 件 。 由 于 磁盘 是 盘 组 、 柱 面 和 磁道 的 三 级 地 址 存 
储 设备 ,因此 对 磁盘 上 的 数据 文件 建立 盘 组 、 柱 面 和 磁道 多 级 索引 。ISAM 文件 由 以 下 3 个 
部 分 组 成 


T" 基 术 数 据 区 


由 一 个 或 多 个 柱 面 组 成 ,文件 的 记录 按 关键 字 有 序 存放 于 柱 面 的 每 个 磁道 上 。 


每 个 柱 面 都 开 一 个 溢出 区 ,为 插入 记录 而 设 。 当 一 个 磁道 存 满 记录 以 后 ,如 果 要 在 该 磁 
道 插入 记录 ,就 将 该 磁道 的 最 后 一 个 记录 移 至 溢出 区 ,再 将 新 记录 插 在 此 磁道 的 适当 位 置 。 
每 个 磁道 的 溢出 数据 在 溢出 区 中 组 成 链表 。 


多 级 索引 都 采用 稀 朴 索引 ,各 级 索引 的 结构 如 下 : 

1) 磁道 索引 

其 包括 基本 索引 项 和 溢出 索引 项 。 基 本 索引 项 含 本 磁道 的 最 大 关键 字 及 起 始 地 址 ; 溢 
出 索引 项 含 本 磁道 溢出 记录 的 最 大 关键 字 及 本 磁道 溢出 区 首 地 址 。 

2) 柱 面 索引 

索引 项 包含 柱 面 中 的 最 大 关键 字 和 该 柱 面 磁道 索引 的 起 始 地 址 。 

3) 主 索引 

主 索引 是 柱 面 索引 的 索引 。 每 个 索引 项 包含 柱 面 索 引 中 一 组 记录 的 最 大 关键 字 及 该 柱 
面 索引 组 的 起 始 地 址 。 检 索 时 由 高 级 索引 到 低级 索引 逐 级 查找 ,找到 待 查 记录 所 在 的 磁道 
后 再 到 此 磁道 中 查找 待 查 记录 。 

图 12. 3 所 示 为 存放 在 盘 组 上 的 一 个 ISAM 文件 的 例子 。 因 柱 面 基本 区 中 的 主 文件 按 
关键 字 有 序 ,因此 可 对 每 个 磁道 上 的 记录 建立 一 个 磁道 索引 项 ,一 个 柱 面 上 的 所 有 磁道 索引 
项 形成 一 个 磁道 索引 。 然 后 对 每 个 磁道 索引 块 ( 即 同属 一 个 柱 面 的 磁道 索引 块 ) 建 立 一 个 柱 
面 索引 项 , 盘 组 上 对 应 主 文件 的 所 有 柱 面 索 引 项 形成 柱 面 索引 。 若 柱 面 索引 较 大 ,再 建立 称 
为 主 索引 的 柱 面 索引 的 索引 。 此 例 只 有 一 级 主 索引 , 若 文件 的 柱 面 索 引 很 大 ,使 得 一 级 主 索 
引 也 很 大 时 , 主 索引 可 建立 多 级 。 当 然 , 若 柱 面 索引 较 小 ,也 可 不 建 主 索引 ,以 减 小 索引 
高 度 。 
















































































































































































































































Cin 柱 面 C 
sl 磁道 索引 六 
CoT~CoT, 20 入 Ros[Ros[ Ri Ri Ro 7 
pr | 32 和 人 | 一 ”| PR | PR | Rs| Ri Ra T，} 基 本 区 
i en EE 攻 
上 本 | 60 Fe 人 Ras | Ras| Rs | Rse | Reo J 
| === | 柱 面 溢出 区 
-070 
280 元 柱 面 C 
sn 上 | [ae | 7 
一 | 70 人 Res | Res | Res | Res | R7o | 也 
3 | a 人 | 上 RRR |Rn|Rs| 六 基本 区 
辣 140 人 | 和 | -RaalRw 
4010 < 
柱 面 溢出 区 
主 索引 
有 CnTo 柱 面 Cy 
se 用 ==3U 磁道 索引 nh 
4010 人 Rao1 |R3a93| R3496| Raa98| Raso0| TI 
柱 面 索 引 一 一 |Raeoo|Raeol| Reo| RaoslRacio| 7 /基本 区 
WW A | R4003| Raoos| Raoo7|R4o1o 
柱 面 溢出 区 











磁道 索引 
图 12.3 ISAM 文件 结构 示例 


由 图 12. 3 可 见 , 每 个 柱 面 分 为 磁道 索引 区 、 基 本 区 和 溢出 区 3 个 部 分 。 磁 道 索引 区 用 
来 存放 该 柱 面 的 磁道 索引 ,通常 规定 该 柱 面 最 前 面 的 磁道 T, 为 磁道 索引 区 。 由 Ti 开始 的 
若干 个 磁道 用 来 存放 主 文件 的 记录 , 称 为 基本 区 。 每 个 柱 面 最 后 若干 个 磁道 称 为 溢出 区 。 
每 个 柱 面 的 溢出 区 由 该 柱 面 基本 区 中 的 各 个 磁道 共享 。 溢 出 区 为 有 序 链表 结构 ,简称 溢出 
链表 。 

一 一 一 一 每 个 磁道 索引 项 有 4 项 , 即 基本 索引 项 关键 字 、 基 
关外 字 | 攻 作 人 关 名 字 | 指针 | 本 索引 项 指针 、 溢 出 索引 项 关键 字 和 溢出 索引 项 指针 ， 

基本 索引 项 溢出 索引 项 其 结构 如 图 12. 4 所 示 ,其 中 基本 索引 项 关键 字 为 对 应 

图 12.4 磁道 索引 项 结构 磁道 在 基本 区 中 最 末 一 个 记录 的 关键 字 ( 即 该 磁道 的 

最 大 关键 字 ) ,基本 索引 项 指针 指示 该 磁道 中 第 一 个 记 

录 在 基本 区 中 的 位 置 ; 溢出 索引 项 关键 字 为 对 应 溢出 链表 的 最 大 关键 字 , 溢 出 索引 项 指针 
为 对 应 溢出 链表 的 头 指针 。 

每 个 柱 面 索引 项 有 两 项 , 即 关键 字 和 指针 。 关 键 字 为 对 应 柱 面 ( 即 对 应 磁道 索引 块 ) 中 
最 后 一 个 记录 的 关键 字 ( 即 该 柱 面 的 最 大 关键 字 ) ,指针 指示 对 应 柱 面 上 的 磁道 索引 首 地 址 。 
如 前 所 述 , 磁 道 索引 放 在 对 应 柱 面 的 第 一 个 磁道 , 即 指针 指示 对 应 柱 面 第 一 个 磁道 中 磁道 索 
引 的 起 始 地 址 。 
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在 数据 文件 初始 建立 时 ,磁道 索引 的 溢出 索引 项 均 为 空 ,各 个 柱 面 洲 出 区 也 均 为 空 。 
图 12. 3 所 示 的 ISAM 文件 就 是 一 个 这 样 的 例子 。 当 有 新 的 记录 插入 时 需要 重组 某 个 磁道 
的 记录 ,并 将 该 磁道 最 后 一 个 记录 移 人 该 柱 面 的 溢出 链表 中 ,同时 修改 对 应 磁道 索引 的 基本 
索引 项 和 溢出 索引 项 内 容 。 

例如 ,依次 将 记录 Re 、R 和 Rx 插 入 到 图 12. 3 所 示 的 文件 中 之 后 , 柱 面 Cs 的 磁道 索引 
及 Cs 柱 面 中 主 文件 记录 存储 位 置 的 变化 情况 如 图 12. 5 所 示 。 当 插入 Re 时 ,由 于 关键 字 
排序 有 63 志 64 所 65 ,所 以 应 将 它 插 在 Cs 柱 面 Ti 磁道 上 第 二 个 记录 的 位 置 上 ,而 T 磁道 上 
从 记录 Rss 开始 的 所 有 记录 依次 后 移 一 个 位 置 ,于 是 Ti 磁道 上 的 最 后 一 个 记录 Rn 被 移 人 
溢出 区 。 由 于 Ti 磁道 上 的 最 大 关键 字 由 70 变 成 了 68, 它 的 溢出 链表 也 由 空 表 变 成 为 含有 
一 个 记录 Rn 的 链表 ,因此 将 磁道 索引 中 对 应 磁道 索引 项 中 的 基本 索引 项 关键 字 由 70 改 成 
68 ,将 溢出 索引 项 关键 字 置 为 70, 并 将 溢出 索引 项 指针 指向 C: 柱 面 溢出 区 中 记录 Rw 的 起 
始 地 址 。 插 入 记录 Rx 和 Rys 的 过 程 和 上 述 插 入 记录 Rs 的 过 程 类 似 , 只 是 溢出 链表 要 求 有 
序 , 所 以 先后 由 基本 区 移入 溢出 区 的 记录 Rs 和 Rs 要 有 序 存放 。 
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图 12.5 ISAM 文件 记录 的 插入 和 溢出 处 理 


在 ISAM 文件 中 删除 记录 的 操作 比较 简单 ,只 要 找到 待 删除 的 记录 ,在 其 存储 位 置 上 
加 一 个 删除 标志 即 可 ,而 不 需要 移动 记录 和 修改 索引 。 

记录 检索 有 成 功 和 失败 两 种 情况 。 在 ISAM 文件 中 记录 检索 成 功 时 的 检索 路 径 有 下 
面 两 种 : 

(1) 车 被 检索 记录 在 某 柱 面 的 基本 区 中 , 则 检索 路 径 为 主 索引 一 柱 面 索引 一 某 磁道 索 
引 一 某 柱 面 基 本 区 中 某 磁道 有 序 表 的 顺序 扫描 。 

(2) 若 被 检索 记录 在 某 柱 面 的 溢出 区 中 , 则 检索 路 径 为 主 索引 一 柱 面 索引 一 某 磁道 索 
引 一 某 柱 面 有 序 溢出 链表 的 顺序 扫描 。 

在 ISAM 文件 中 记录 检索 失败 时 的 检索 路 径 也 有 两 种 : 

(1) 主 索引 一 柱 面 索引 一 某 磁道 索引 一 某 柱 面 基 本 区 中 某 磁道 有 序 表 的 顺序 扫描 一 检 
索 失 败 。 

(2) 主 索引 一 柱 面 索 引 一 某 磁道 索引 -~ 某 柱 面 有 序 溢出 链表 的 顺序 扫描 一 检索 失败 。 

例如 要 在 图 12. 3 所 示 的 文件 中 检索 记录 Res , 先 查 主 索引 , 因 65 二 280, 所 以 进入 柱 面 
索引 的 第 一 个 索引 块 ; 因 65 二 140, 又 进入 磁道 索引 的 第 二 个 索引 块 ; 因 65 二 70, 又 进入 C。 
柱 面 的 TT 磁道 ; 对 Ti 磁道 按 有 序 顺 序 表 法 查找 ,检索 到 记录 Rss 后 成 功 返 回 。 又 例如 要 在 
图 12. 3 中 部 分 修改 成 图 12. 5 所 示 的 ISAM 文件 中 的 检索 记录 Rn , 先 查 主 索引 , 因 70 一 
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280, 所 以 进入 柱 面 索引 的 第 一 个 索引 块 ; 因 70 二 140, 又 进入 磁道 索引 的 第 二 个 索引 块 ; 
70 过 70, 又 进入 C: 柱 面 Ti 磁道 溢出 链表 ; 对 该 溢出 链表 按 有 序 链表 法 查找 ,检索 到 记录 
Rn 后 成 功 返 回 。 

在 ISAM 文件 中 经 过 多 次 记录 增删 后 文件 的 结构 可 能 变 得 很 不 合理 ,此 时 大 量 的 记录 
进入 洲 出 区 ,而 基本 区 中 又 浪费 了 很 多 的 空间 ,因此 通常 需要 周期 性 地 整理 ISAM 文件 ,把 
记录 读 人 内 存 重新 排列 ,复制 成 一 个 新 的 ISAM 文件 , 填 满 基本 区 而 空 出 溢出 区 。 


1232 VSAM 文 件 


VSAM 是 虚拟 存储 存 取 方法 (virtual storage access method) 的 英文 缩写 。VSAM 文 
件 是 一 种 采用 虚拟 存储 存 取 方法 的 文件 。VSAM 文件 的 存储 单位 是 控制 区 间 和 控制 区 域 ， 
这 是 一 些 迎 辑 存 储 单位 ,与 柱 面 \ 磁 道 等 实际 存储 单位 并 没有 必然 的 联系 。 用 户 在 存 取 
VSAM 文件 的 记录 时 不 需要 考虑 该 记录 的 当前 位 置 是 在 内 存 还 是 在 外 存 , 也 不 需要 考虑 何 
时 执行 对 外 存 进 行 读 写 的 命令 。 可 见 , 这 种 文件 较 ISAM 文件 更 方便 用 户 使 用 。 

就 文件 的 组 织 方式 来 说 ,VSAM 文件 和 ISAM 文件 的 相同 点 是 都 是 索引 顺序 文件 组 织 
方式 ,其 不 同 点 是 ISAM 文件 采用 静态 索引 结构 ,而 VSAM 采用 B 十 树 的 动态 索引 结构 。 
有 关 B 十 树 的 概念 已 在 第 9 章 介 绍 ,这 里 不 再 讨论 。 

图 12. 6 所 示 为 一 个 VSAM 文件 的 例子 , 它 由 数据 集 、 顺 序 集 和 索引 集 3 个 部 分 组 成 。 
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12.6 VSAM 文件 结构 举例 


(1) 数据 集 : 一 个 结 点 称 为 一 个 控制 区 间 , 它 是 IO 操作 的 一 个 基本 单位 。 文 件 的 记 








录 存 放 于 数据 集中 。 一 个 控制 区 间 除 存放 一 个 或 多 个 记录 以 外 ,还 包含 有 记录 的 控制 信息 ~ 


和 区 间 的 控制 信息 , 且 每 个 控制 区 间 留 有 空间 ,为 插入 记录 时 备用 。 

(2) 顺序 集 : 存放 每 个 控制 区 间 的 索引 项 ,一 个 索引 项 包含 该 控制 区 间 的 最 大 关键 字 
和 指向 区 间 的 指针 。 若 干 个 控制 区 间 的 索引 项 组 成 顺序 集中 的 一 个 结 点 , 结 点 之 间 用 指针 
链接 ,使 整个 顺序 集 形 成 一 个 链表 。 顺 序 集 中 一 个 结 点 和 与 之 对 应 的 控制 区 间 组 成 一 个 控 
制 区 域 。 

(3) 索引 集 : 每 个 顺序 集 的 结 点 又 在 其 上 一 层 的 结 点 中 建立 索引 , 且 逐 层 向 上 建立 索 
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引 , 每 个 索引 项 都 是 由 下 层 若 干 个 结 点 的 最 大 关键 字 和 指向 这 些 结 点 的 指针 组 成 。 这 些 上 
层 的 索引 组 成 了 索引 集 。 它 们 是 B 十 树 的 非 终端 结 点 ,与 顺序 集 共 同 构成 一 棵 B 十 树 , 作 为 
文件 的 索引 部 分 。 

VSAM 文件 的 记录 均 存 放 在 数据 集中 (其 中 的 一 个 结 点 就 是 一 个 控制 区 间 ) ,每 个 控制 
区 间 存 放 有 若干 个 按 关 键 字 有 序 排列 的 记录 。 控 制 区 间 的 大 小 可 随 文件 的 不 同 而 不 同 ,但 
同一 文件 中 控制 区 间 的 大 小 相同 。 顺 序 集 和 索引 集 一 起 构成 一 棵 B 十 树 , 为 有 序 记 录 的 索 
引 。 顺 序 集 和 索引 集中 的 所 有 索引 项 都 由 关键 字 和 指针 两 部 分 组 成 。 每 个 控制 区 间 在 顺序 
集中 都 有 一 个 索引 项 ,其 关键 字 为 控制 区 间 中 记录 的 最 大 关键 字 , 其 指针 为 该 控制 区 间 的 首 
地 址 。 顺 序 集中 的 一 个 结 点 和 对 应 的 若干 个 控制 区 间 组 成 的 部 分 称 为 控制 区 域 。 每 个 控制 区 
间 可 看 作 一 个 逻辑 磁道 ,每 个 控制 区 域 可 看 作 一 个 逻辑 柱 面 ,而 控制 区 间 相 当 于 一 个 磁道 。 

与 ISAM 文件 不 同 的 是 ,VSAM 文件 不 设 溢出 区 ,解决 记录 插入 的 方法 是 在 文件 初始 
建立 时 留 下 一 定 的 空间 。 预 留 空 间 使 用 两 种 方法 ,一 种 方法 是 每 个 控制 区 间 初 建 时 不 填 满 
记录 ,如 图 12.6 中 的 控制 区 间 定 义 为 存放 3 个 记录 ,而 初 建 时 每 个 控制 区 间 最 多 只 放 两 个 
记录 ; 另 一 种 方法 是 在 每 个 控制 区 域 中 留 有 一 些 全 空 的 控制 区 间 ,图 12. 6 中 有 一 个 这 样 的 
全 空 的 控制 区 间 。 

在 VSAM 文件 中 记录 插入 有 4 种 情况 : 

(1) 新 记录 能 直接 插入 到 相应 的 控制 区 间 中 ,但 需要 修改 顺序 集中 的 索引 项 。 

(2) 新 记录 插入 的 控制 区 间 未 满 ,但 需 把 其 中 关键 字 大 于 插入 记录 关键 字 的 记录 后 移 。 

(3) 新 记录 要 插入 的 控制 区 间 中 记录 已 满 ,此 时 要 进行 控制 区 间 的 分 裂 , 即 将 近 一 半 的 
记录 移 到 同一 控制 区 域 中 全 空 的 控制 区 间 中 ,并 修改 顺序 集中 相应 的 索引 。 

(4) 新 记录 要 插入 的 控制 区 域 中 已 没有 全 空 的 控制 区 间 ,要 进行 控制 区 域 的 分 裂 ,此 时 
顺序 集中 的 结 点 也 要 分 裂 。 

记录 的 删除 过 程 与 插入 过 程 相反 , 当 要 删除 记录 时 先 查 找到 该 记录 ,然后 将 该 记录 右面 
的 记录 顺 次 左 移 以 使 空闲 空间 连续 ,同时 删除 相应 的 控制 信息 。 若 删除 后 该 控制 区 间 不 再 
含有 记录 , 则 回收 做 空闲 空间 使 用 ,同时 删除 顺序 集中 相应 的 索引 项 。 

与 ISAM 文件 相 比 ,VSAM 文件 具有 以 下 优点 : 动态 地 分 配 和 释放 存储 空间 ; @ 不 
需要 对 文件 进行 重组 ; 图 插入 新 记录 后 对 新 记录 的 查找 时 间 和 对 原 有 记录 的 查找 时 间 
相同 。 

基于 B 十 树 的 VSAM 文件 通常 作为 大 型 索引 顺序 文件 的 标准 组 织 方式 。 





哈 希 文件 


哈 希 文件 (hashed file) 也 称 为 散 列 文件 ,是 利用 哈 希 存储 方式 组 织 的 文件 ,也 称 为 直接 
存 取 文 件 。 它 类 似 于 哈 希 表 , 即 根据 文件 中 关键 字 的 特点 设计 一 个 哈 希 函数 和 处 理 冲突 的 
方法 ,将 记录 哈 希 到 存储 设备 上 。 

与 哈 希 表 不 同 的 是 ,对 于 文件 来 说 ,磁盘 上 的 文件 记录 通常 是 成 组 存放 的 ,若干 个 记录 
组 成 一 个 存储 单位 ,在 哈 希 文件 中 这 个 存储 单位 叫 桶 (bucket) 。 假 如 一 个 桶 能 存放 m 个 记 
录 , 则 当 桶 中 已 有 m 个 同义词 的 记录 时 存放 第 mm 十 1 个 同义词 会 发 生 * 洪 出 ”。 处 理 溢出 虽 


2 文 件 | 


然 可 采用 哈 希 表 中 处 理 冲 突 的 各 种 方法 ,但 对 哈 希 文件 而 言 主 要 采用 链 地 址 法 。 

当 发 生 * 洪 出 ?时 ,需要 将 第 mm 十 1 个 同义词 存放 到 另 一 个 桶 中 ,通常 称 此 桶 为 “溢出 
桶 ”。 相 应 的 , 称 前 疡 个 同义词 存放 的 桶 为 “ 基 桶 ”。 溢 出 桶 和 基 桶 大 小 相同 ,相互 之 间 用 指 
针 链接 。 当 在 基 桶 中 没有 找到 待 查 记 录 时 就 沿 着 指针 到 所 指 溢出 桶 中 进行 查找 ,因此 希望 
同一 哈 希 地 址 的 溢出 本 和 基 桶 在 磁盘 上 的 物理 位 置 不 要 相距 太 远 ,最 好 在 同一 柱 面 上 。 

【 例 12.1】 某 一 文件 有 20 个 记录 ,其 关键 字 集 合 为 (2,23,5,26,1,3,24,18,27,12,7， 
9,4,19,6,16,33,11,10,13) , 桶 的 容量 二 3, 桶 数 "一 7, 用 除 留 余数 法 做 哈 希 函数 H(key) 二 
key%7, 给 出 对 应 的 哈 希 文件 。 

对 应 的 哈 希 文件 如 图 12.7 所 示 。 

本 编号 基 桶 溢出 桶 
入 
入 
23 | 9 | 一 | 16 人 
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图 12.7 哈 希 文件 示例 


在 喻 希 文件 中 进行 查找 时 首先 根据 给 定 值 求 出 喻 希 桶 的 地 址 ,将 基 桶 的 记录 读 入 内 存 ， 
进行 顺序 查找 , 若 找到 关键 字 等 于 给 定 值 的 记录 , 则 检索 成 功 ; 否则 , 读 入 溢出 桶 的 记录 继 
续 进 行 查找 。 

在 哈 希 文件 中 删 去 一 个 记录 仅 需 对 被 删 记 录 做 删除 标记 即 可 。 

哈 希 文件 的 优点 是 文件 随机 存放 ,记录 不 需 进行 排序 ; 插入 、 删 除 方便 ; 存 取 速度 快 ; 
不 需要 索引 区 ,节省 存储 空间 。 其 缺点 是 不 能 进行 顺序 存 取 ,只 能 按 关键 字 随 机 存 取 , 且 询 
问 方式 限于 简单 询问 ,并 且 在 经 过 多 次 插入 、 删 除 后 也 可 能 造成 文件 结构 不 合理 ,需要 重新 
组 织 文件 。 


以 上 各 节 介 绍 的 都 是 只 含 一 个 主 关键 字 的 文件 。 为 了 提高 查找 效率 ,还 需要 对 被 查询 
的 次 关键 字 建 立 相 应 的 索引 ,这 种 包含 有 多 个 次 关键 字 索 引 的 文件 称 为 多 关键 字 文 件 
(multiple key file) 。 次 关键 字 索 引 本 身 可 以 是 顺序 表 , 也 可 以 是 树 表 。 下 面 讨 论 两 种 多 关 
键 字 文 件 的 组 织 方法 。 


i 
1251 多 重 表 文 件 
多 重 表 文 件 (multilist file) 是 将 索引 方法 和 和 链接 方法 相 结 合 的 一 种 组 
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织 方式 , 它 对 每 个 需要 查询 的 次 关键 字 建 立 一 个 索引 ,同时 将 具有 相同 次 关键 字 的 记录 链接 
成 一 个 链表 ,并 将 此 链表 的 头 指针 、 链 表 长 度 及 次 关键 字 作 为 索引 表 的 一 个 索引 项 。 通 常 ， 
多 重 表 文 件 的 主 文件 是 一 个 顺序 文件 。 

【 例 12.2】 图 12. 8(a) 是 一 个 多 重 表 文 件 的 示例 , 主 关键 字 是 学 号 ,次 关键 字 是 性 别 、 
民族 和 班 号 ,设计 对 应 的 多 重 表 文 件 。 

设计 3 个 链接 字段 ,分 别 将 具有 相同 性 别 、 民 族 和 班 号 的 记录 链 在 一 起 ,由 此 形成 
的 性 别 、 民 族 和 班 号 索引 见 图 12. 8(b) .图 12.8(c) 和 图 12.8(d), 有 了 这 些 索 引 便于 处 理 各 
种 有 关 次 关键 字 的 查询 。 































































































物理 地 址 | 学 号 | 姓名 性 别 民族 班 号 性 别 链 民族 链 班 号 链 

1 1 李 明 男 汉族 99101 2 2 2 

2 3 王 平 男 汉族 99101 3 4 4 

SL 3 陈强 男 满族 99102 5 和 5 

4 8 张 萍 女 汉族 99101 人 人 人 

5|L 4 马 伟 男 回族 99102 入 入 入 

(a) 多 重 表 文件 
次 关键 字 | 头 指针 | 链 长 次 关键 字 | 头 指针 | 链 长 次 关键 字 | 头 指针 | 链 长 
男 1 4 汉族 1 3 99101 1 3 
女 4 1 满族 3 1 99102 3 2 
回族 5 1 
(b) 性 别 索引 (c) 民族 索引 (d) 班 号 索引 


图 12.8 多 重 表 文件 示例 


多 重 表 文件 在 检索 时 同样 先 查 询 索引 表 , 然 后 在 主 文件 中 读 出 待 查 记 录 信 息 ; 插入 时 
如 果 不 要 求 保持 链表 的 某 种 次 序 , 则 可 将 新 记录 插 在 链表 的 头 指针 之 后 ; 删除 记录 时 比较 
烦琐 ,需要 在 每 个 次 关键 字 的 链表 中 删 去 该 记录 。 


1252 倒 排 文件 


倒 排 文件 (inverted file) 和 多 重 表 文件 的 区 别 在 于 具有 相同 次 关键 字 的 记录 不 进行 链 
接 ,而 是 在 相应 的 次 关键 字 索 引 表 的 该 索引 项 中 直接 列 出 这 些 记录 的 物理 地 址 或 记录 号 。 
这 样 的 索引 表 称 为 倒 排 表 , 由 主 文 件 和 倒 排 表 共同 组 成 倒 排 文件 。 

【 例 12.3】 设计 与 图 12. 8(a) 对 应 的 倒 排 文件 。 

将 图 12. 8(a) 所 示 的 多 重 表 文件 去 掉 3 个 链接 字段 后 作为 主 文件 ,所 建立 的 性 别 、 
民族 和 班 号 倒 排 表 分 别 如 图 12. 9(a)、 图 12. 9(b) 和 图 12.9(c) 所 示 , 倒 排 表 和 主 文件 一 起 就 
构成 了 倒 排 文件 。 在 这 些 倒 排 表 中 ,各 索引 项 的 物理 地 址 是 有 序 的 ,也 可 以 将 这 些 物理 地 址 
按 主 关键 字 有 序 排 列 。 



































次 关键 字 | 物理 地 址 次 关键 字 物理 地 址 次 关键 字 “| 。 物理 地 址 
男 | 12.3.5 汉族 1,2,4 99101 | 1124 
女 | 4 满族 3 99102 | 3 
回族 5 
(a) 性 别 倒 排 表 (b) 民族 倒 排 表 (c) 班 号 排 表 


图 12.9 3 个 倒 排 表 
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倒 排 文 件 的 主要 优点 是 检索 记录 较 快 ,在 处 理 复 杂 的 多 关键 字 查询 时 可 在 倒 排 表 中 确 
定 记录 是 哪个 或 哪些 ,继而 直接 读 取 之 ; 倒 排 文件 的 缺点 是 维护 困难 ,在 同一 个 倒 排 表 中 不 
同 关键 字 的 记录 数 不 同 , 各 倒 排 表 的 长 度 也 不 等 。 


iv 本 章 小 结 一 一 一 


本 章 的 基本 学 习 要 点 如 下 : 

(1) 理解 文件 的 基本 概念 。 

(2) 掌握 各 种 文件 的 结构 ,包括 顺序 文件 .索引 文件 .索引 顺序 文件 、 哈 希 文件 和 多 关键 
字 文 件 等 。 





二 练习 题 12 “一 一 


1. 什么 是 文件 的 逻辑 记录 和 物理 记录 ? 它们 有 什么 区 别 与 联系 ? 
2 比较 顺序 文件 .索引 非 顺序 文件 .索引 顺序 文件 和 哈 希 文件 的 存储 代价 、 检 索 、 插 入 




















及 删除 记录 时 的 优点 和 缺点 。 
3. 某 职工 表 文 件 如 图 12. 10 所 示 ,其 中 以 职工 号 为 主 关键 字 。 
物理 地 址 | 职工 号 姓名 | 年 龄 | 性 别 | 工作 时 间 职称 
1 105 李 华 | 36 | 男 1997.7 副教授 
125 于 丽 | 42 | 女 1984.7 副教授 
3 108 1998.7 
4 
5 
6 




















12.10 一 个 职工 表 


(1) 车 将 职工 文件 组 织 成 顺序 有 序 文件 ,请 给 出 文件 的 存储 结构 。 

(2) 若 将 该 文件 组 织 成 索引 非 顺 序 文件 ,请 给 出 其 索引 表 结 构 。 

(3) 若 将 该 文件 组 织 成 多 重 表 文 件 , 请 给 出 主 文 件 结构 及 性 别 索引 ,工作 时 间 索 引 ( 只 
考虑 年 份 ) 及 年 龄 段 (10 岁 为 一 个 年 龄 段 ) 索 引 。 

(4) 若 将 该 文件 组 织 成 倒 排 文件 ,请 写 出 性 别 索引 、 职 称 索引 及 年 龄 段 索引 ,组 织 索 引 
要 求 同 (3)。 





一 人 上 机 实验 题 12 一 和 一 


戎 验证 性 实验 
实验 题 1: 实现 学 生 记录 文件 的 创建 和 查找 基本 操作 
目的 : 领会 C/C++ 文件 的 基本 操作 及 其 算法 设计 。 
内 容 : 有 若干 个 学 生成 绩 记录 如 表 12. 1 所 示 ,假设 它们 存放 在 st 数组 中 ,设计 一 个 程 
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序 exp12-1. cpp 完成 以 下 功能 。 
(1) 将 st 数组 中 的 学 生 记 录 写 人 到 stud. dat 文件 中 。 
(2) 在 stud. dat 文件 中 查找 并 显示 指定 学 生 序 号 的 学 生 记录 。 
(3) 在 stud. dat 文件 中 查找 并 显示 指定 学 生 学 号 的 学 生 记 录 。 


表 12.1 学 生成 绩 表 








学 号 姓名 年 龄 性 别 语文 分 数学 分 英语 分 
陈 华 20 男 78 90 84 
5 张 明 21 男 78 68 92 
8 王 英 20 女 86 81 86 
3 刘 丽 21 女 78 92 88 
这 许可 20 男 80 83 78 
4 陈 军 20 男 78 88 82 
7 马 胜 21 男 56 67 ”5 
6 曾 强 20 男 78 89 82 
戎 设计 性 实验 


实验 题 2: 实现 学 生 记录 文件 复杂 的 基本 操作 

目的 : 掌握 文件 的 基本 操作 及 其 算法 设计 。 

内 容 : 有 若干 个 学 生成 绩 记 录 如 表 12. 1 所 示 ,假设 它们 存放 在 st 数组 中 ,设计 一 个 程 
序 exp12-2. cpp 完成 以 下 功能 。 

(1) 将 st 数组 中 的 学 生 记 录 写 入 到 stud. dat 文件 中 。 

(2) 将 stud. dat 文件 中 的 所 有 学 生 记 录 读 人 到 st 数组 中 。 

(3) 显示 st 数组 中 的 所 有 学 生 记 录 。 

(4) 将 st 数组 的 学 生 记 录 复 制 到 stl 数组 中 ,并 对 stl 数组 的 所 有 学 生 记录 求 平均 分 。 

(5) 对 stl 数组 的 所 有 学 生 记录 按 平均 分 递减 排序 。 

(6) 将 stl 数组 中 的 学 生 记录 写 入 studl. dat 文件 。 

(7) 将 studl. dat 文件 中 的 学 生 记录 读 入 到 stl 数组 中 。 

(8) 显示 stl 数组 中 的 学 生 记录 。 


实验 题 3: 实现 索引 文件 的 建立 和 查找 算法 

目的 : 掌握 索引 文件 的 基本 操作 及 其 算法 设计 。 

内 容 : 编写 一 个 程序 exp12-3. cpp, 建 立 表 12. 1 中 学 生成 绩 记 录 对 应 的 主 文件 data. 
dat, 要 求 完成 以 下 功能 。 

(1) 输出 主 文件 中 的 学 生 记录 。 

(2) 建立 与 主 文件 相对 应 的 索引 文件 ,其 中 每 个 记录 由 两 个 字段 组 成 , 即 学 号 no 和 该 
学 生 记 录 在 数据 文件 中 的 相应 位 置 offset。 索 引文 件 中 的 记录 按 学 号 no 升序 排列 。 

(3) 输出 索引 文件 的 全 部 记录 。 

(4) 根据 用 户 输入 的 学 号 在 索引 文件 中 采用 折 半 查找 法 找到 对 应 的 记录 号 ,再 通过 主 
文件 输出 该 记录 。 








数据 结构 课程 的 核心 内 容 是 培养 学 生 分 析 数 据 \ 组 织 数据 的 能 
力 , 其 目的 是 编写 高 质量 的 程序 。 程 序 设 计 主要 有 结构 化 方法 和 面 
向 对 象 的 方法 , 目前 面向 对 象 的 方法 已 成 为 软件 开发 的 主流 方法 。 
前 面 各 章 都 是 采用 结构 化 方法 描述 算法 。 

本 章 介绍 采用 C++ 面 向 对 象 程序 设计 的 概念 和 描述 数据 结构 基 
本 算法 的 过 程 , 为 更 高 层次 地 开发 数据 处 理 软 件 打 下 扎实 的 基础 。 
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面向 对 象 的 概念 光 


计算 机 程序 是 计算 机 处 理 对 象 和 计算 规则 的 描述 。 程 序 设计 语言 是 用 来 描述 计算 机 事 
务 处 理 过 程 、 便 于 计算 机 执行 的 规范 化 语言 。 

在 出 现 高 级 语言 之 后 ,如 何 用 它 来 编写 较 大 的 程序 呢 ? 人 们 把 程序 看 成 是 处 理 数 据 的 
一 系列 过 程 。 过 程 或 函数 定义 为 一 个 接 一 个 顺序 执行 的 一 组 指令 。 数 据 与 程序 分 开 存储 ， 
程序 设计 的 主要 技巧 在 于 追踪 哪些 函数 和 调用 哪些 函数 ,哪些 数据 发 生 了 变化 。 为 解决 其 
中 可 能 存在 的 问题 ,结构 化 程序 设计 应 运 而 生 。 结 构 化 程序 设计 的 主要 思想 是 功能 分 解 并 
逐步 求 精 , 也 就 是 说 , 当 要 设计 某 个 目标 系统 时 先 从 代表 目标 系统 整体 功能 的 单个 处 理 着 
手 , 自 顶 向 下 不 断 地 把 复杂 的 处 理 分 解 为 子 处 理 ,这 样 一 层 一 层 地 分 解 下 去 ,直到 仅 剩 下 若 
干 个 容易 处 理 的 子 处 理 为 止 。 当 所 分 解 出 的 子 处 理 已 经 十 分 简单 ,其 功能 显而易见 时 ,就 停 
止 这 种 分 解 过 程 ,对 每 个 这 样 的 子 处 理 用 程序 加 以 实现 。 结 构 化 程序 设计 仍然 存在 诸多 问 
题 ,例如 生产 率 低下 、 软 件 代码 重用 程度 低 、 软 件 仍 然 很 难 维护 等 。 针 对 结构 化 程序 设计 的 
缺点 ,人 们 提出 了 面向 对 象 的 程序 设计 方法 。 

面向 对 象 程序 设计 的 本 质 是 把 数据 和 处 理 数据 的 过 程 当 成 一 个 整体 , 即 对 象 。 面 向 对 
象 程序 语言 包含 下 面 一 些 概 念 。 扫 -- 扫 

LS 

对 象 是 人 们 要 进行 研究 的 任何 实际 存在 的 事物 , 它 具 有 属性 (用 数据 来 
描述 ) 和 方法 (用 于 处 理 数 据 的 算法 )。 面 向 对 象 语言 把 属性 和 方法 封装 于 ee 
对 象 体 之 中 ,并 提供 一 种 访问 机 制 , 使 对 象 的 “私有 数据 " 仅 能 由 这 个 对 象 的 要 二 WI 
方法 来 执行 。 用 户 只 能 通过 向 允许 公开 的 方法 提出 要 求 (消息 ) 才 能 查询 和 修改 对 象 的 状 
态 。 这 样 ,对象 属 性 的 具体 表示 和 方法 的 具体 实现 都 是 隐蔽 的 。 

ra 

把 众多 事物 归纳 、 划 分 成 一 些 类 ,把 具有 共性 的 事物 划分 为 一 类 ,得 出 一 个 抽象 的 概念 ， 
是 人 类 认识 世界 经 常 采用 的 思维 方法 。 类 是 面向 对 象 语言 必须 提供 的 用 户 定 义 的 数据 类 
型 , 它 将 具有 相同 状态 、 操 作 和 访问 机 制 的 多 个 对 象 抽象 成 为 一 个 对 象 类 。 在 定义 了 类 以 
后 ,属于 这 种 类 的 一 个 对 象 叫 作 类 实例 或 类 对 象 。 一 个 类 的 定义 应 包括 类 名 、 类 的 说 明和 类 
的 实现 。 

3 继承 

继承 是 面向 对 象 语言 的 另 一 个 必 备 要 素 。 类 与 类 之 间 可 以 组 成 继承 层次 ,一 个 类 的 定 
义 ( 称 为 子 类 ) 可 以 定义 在 另 一 个 已 定义 类 ( 称 为 父 类 ) 的 基础 上 。 子 类 可 以 继承 父 类 中 的 属 
性 和 操作 ,也 可 以 定义 自己 的 属性 和 操作 ,从 而 使 内 部 表示 上 有 差异 的 对 象 可 以 共享 与 它们 
结构 有 共同 部 分 的 有 关 操 作 ,达到 代码 重用 的 目的 。 

对 象 引 用 一 个 方法 的 过 程 称 为 向 该 对 象 发 送 一 个 消息 ,或 者 说 一 个 对 象 接收 到 一 个 服 
务 请 求 。 消 息 是 对 象 之 间 交 互 的 手段 。 
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通常 人 们 定义 面向 对 象 一 对 象 十 类 十 继承 十 消息 。 
面向 对 象 方法 的 主要 优点 如 下 : 


EU 一 

结构 化 程序 设计 是 面向 过 程 的 ,以 算法 为 核心 ,把 数据 和 处 理 过 程 作为 相互 独立 的 
部 分 。 面 向 对 象 程序 设计 以 对 象 为 中 心 , 对 象 是 一 个 统一 体 , 它 是 由 措 述 内 部 状态 表示 
静态 属性 的 数据 以 及 可 以 对 这 些 数 据 施加 的 操作 封装 在 一 起 所 构成 的 。 面 向 对 象 设计 
方法 是 对 间 题 领域 进行 自然 分 解 , 确 定 需要 使 用 的 对 象 和 类, 建立 适当 的 关 等 级 ,在 对 象 
之 间 传 递 消息 实现 必要 的 联系 ,从 而 按照 人 们 习惯 的 思维 方式 建立 起 问题 域 的 模型 , 模 
拟 客观 世界 。 


EMULEJil3ueeee 一 

面向 对 象 的 软件 技术 在 利用 可 重用 的 软件 成 分 构造 新 的 软件 系统 时 有 很 大 的 灵活 性 。 
有 两 种 方法 可 以 重复 使 用 一 个 对 象 类 ,一 种 方法 是 创建 该 类 的 实例 ,从 而 直接 使 用 它 ; 另 一 
种 方法 是 从 它 派生 出 一 个 满足 当前 需要 的 新 类 。 继 承 性 机 制 使 得 子 类 不 仅 可 以 重用 其 父 类 
的 数据 结构 和 程序 代码 ,而 且 可 以 在 父 类 代码 的 基础 上 方便 地 修改 和 扩充 ,这 种 修改 并 不 影 
响 对 原 有 类 的 使 用 。 


ED 

类 是 理想 的 模块 机 制 , 它 的 独立 性 好 ,修改 一 个 类 通常 很 少 会 涉及 其 他 类 。 如 果 仅 修改 
一 个 类 的 内 部 实现 部 分 (私有 数据 成 员 或 成 员 函 数 的 算法 ) ,而 不 修改 该 类 的 对 外 接口 , 则 可 
以 完全 不 影响 软件 的 其 他 部 分 。 面 向 对 象 软件 技术 特有 的 继承 机 制 使 得 对 软件 的 修改 和 扩 
充 比 较 容 易 实 现 ,通常 只 要 从 已 有 类 派生 出 一 些 新 类 ,无 须 修 改 软件 的 原 有 成 分 。 面 向 对 象 
软件 技术 的 多 态 性 机 制 使 得 扩充 软件 功能 时 对 原 有 代码 所 需 做 的 修改 进一步 减少 ,需要 增 
加 的 新 代码 也 比较 少 。 所 以 ,用 面向 对 象 方法 设计 的 程序 具有 很 好 的 可 维护 性 。 

正 因 为 面向 对 象 程序 设计 有 诸多 的 优点 ,所 以 程序 设计 方法 逐渐 由 结构 化 程序 设计 发 
展 为 面向 对 象 程序 设计 。 


用 C++ 描述 面向 对 象 的 程序 光 


C++ 是 一 种 广泛 应 用 的 程序 设计 语言 , 它 在 C 语言 的 基础 上 扩展 了 面向 对 象 的 程序 设 
计 特 点 。 最 主要 的 是 增加 了 类 功能 ,使 它 成 为 面向 对 象 的 程序 设计 语言 ,从 而 提高 了 开发 软 
件 的 效率 。 
1321 类 

从 语言 角度 来 说 ,类 是 一 种 数据 类 型 ,而 对 象 是 具有 这 种 类 型 的 变量 。 拓 - 枯 
当 有 int n 说 明之 后 ,类 与 对 象 的 关系 如 同 int 类 型 与 变量 n 之 间 的 关系 。 人 


ES 一 


类 是 一 种 用 户 自 定义 的 数据 类 型 ,声明 类 的 一 般 格 式 如 下 : 
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class 类 名 
{ 
private: 
私有 数据 成 员 和 成 员 函 数 ; 
protected : 
保护 数据 成 员 和 成 员 函 数 ; 
public: 
公有 数据 成 员 和 成 员 函 数 ; 


}; 
各 个 成 员 函 数 的 实现 ; 


其 中 ,class 是 定义 类 的 关键 字 。“ 类 名 ”是 一 个 标识 符 , 用 于 唯一 标识 一 个 类 。 一 对 大 括号 
内 是 类 的 声明 部 分 ,指定 该 类 的 所 有 成 员 。 类 的 成 员 包 含 数据 成 员 和 成 员 函 数 两 部 分 。 类 
的 成 员 从 访问 权限 上 分 有 : 公有 的 (public)、 私 有 的 (private) 和 保护 的 (protected)3 类 ,其 
中 默认 为 private 权限 。 

【 例 13. 1】 以 下 声明 了 一 个 Sample, 指 出 其 私有 和 公有 成 员 。 


class Sample // 定 义 类 Sample 
{ 
Private: 

intx, yi; // 数 据 成 员 
public: 

void setvalue(int xl,int yl); // 成 员 函 数 

void display() ; 


}; 
void Sample: : setvalue(int xl,int y1){ x=xl;y=y];} 
void Sample: :display() 
{ 

cout <<"x 一 "<< x <<", y="<< y << endl; 


从 Sample 类 的 声明 看 出 ,该 类 包含 两 个 私有 数据 成 员 zx 和 y ,它们 都 是 int 型 的 ， 
以 及 两 个 公有 成 员 函 数 setvalue() 和 display()。 该 类 的 描述 如 图 13. 1 所 示 。 


























类 Sample 
外 setvalue 内 部 数据 成 员 
成 
员 
数 display 


图 13.1 Sample 类 的 描述 


2 类 的 成 员 务 数 


类 的 成 员 函 数 对 类 的 数据 成 员 进 行 操作 ,成 员 函 数 的 定义 体 可 以 在 类 的 声明 体 中 ,也 可 
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以 在 类 的 声明 体外 ,如 例 13. 1 中 的 成 员 函 数 setvalue() 和 display() 是 在 类 声明 体外 实现 
的 。 在 类 声明 体 中 定义 的 函数 都 是 内 联 函数 。 在 类 声明 体外 实现 的 函数 可 以 通过 在 函数 声 
明和 定义 上 分 别 加 inline 来 表示 该 函数 是 内 联 的 ,否则 不 是 内 联 函 数 。 

在 类 的 声明 体内 定义 成 员 函 数 的 优点 是 使 整个 类 集中 于 程序 代码 的 同一 位 置 ,不 利 的 
方面 是 增加 了 类 声明 的 规模 和 复杂 性 ,而 且 内 联 的 函数 代码 并 不 被 相同 类 的 对 象 所 共享 , 因 
而 增 大 了 程序 的 内 存 开 销 。 


类 成 员 有 3 类 访问 权限 , 即 公 有 (public)、 私 有 (private) 和 保护 (protected)。 声 明 为 公 
有 的 成 员 可 以 被 程序 中 的 任何 代码 访问 ; 声明 为 私有 的 成 员 只 能 被 类 本 身 的 成 员 函 数 及 友 
元 类 的 成 员 函 数 访问 ,其 他 类 的 成 员 函 数 ,包括 其 派生 类 的 成 员 函 数 都 不 能 访问 它们 ; 声明 
为 保护 的 成 员 与 私有 成 员 类 似 ,只 是 除了 类 本 身 的 成 员 函 数 和 声明 为 友 元 类 的 成 员 函 数 可 
以 访问 保护 成 员 以 外 ,该 类 的 派生 类 的 成 员 也 可 以 访问 。 

这 里 需要 先 区 分 类 的 成 员 对 类 对 象 的 可 见 性 和 对 类 的 成 员 函 数 的 可 见 性 的 不 同 。 类 的 
成 员 函 数 可 以 访问 类 的 所 有 成 员 , 没 有 任何 限制 ,而 类 的 对 象 对 类 的 成 员 的 访问 是 受 成 员 访 
问 控 制 符 制约 的 。 例 如 声明 一 个 类 Samplel 如 下 : 


class Samplel 
{ 
private: 
int i; 
protected: 
int j; 
public: 
int k; 
int geti() { return i; } // 类 的 成 员 函 数 可 以 访问 类 的 私有 成 员 
int getj() { return j; } // 类 的 成 员 函 数 可 以 访问 类 的 保护 成 员 
int getk() { return k; } // 类 的 成 员 函 数 可 以 访问 类 的 公有 成 员 
}; 


定义 该 类 的 一 个 对 象 s: 





Samplel s; 

其 成 员 访 问 的 合法 性 如 下 : 

Ba // 非 法 ,i 为 Samplel 的 私有 成 员 

人 一 


类 Samplel 具有 私有 成 员 i, 它 可 以 由 类 Samplel 的 成 员 函 数 geti() 访 问 , 保 护 成 员 和 
公有 成 员 也 一 样 ,但 是 不 能 通过 类 Samplel 的 实例 对 象 来 访问 类 Samplel 的 私有 成 员 i 和 
保护 成 员 j。 

一 般 来 说 ,公有 成 员 是 类 的 对 外 接口 ,而 私有 成 员 和 保护 成 员 是 类 的 内 部 实现 ,不 希望 
外 界 了 解 。 将 类 的 成 员 划 分 为 不 同 访问 级 别 有 两 个 好 处 ,一 是 信息 隐蔽 , 即 实现 的 封装 ,将 
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类 的 内 部 实现 和 外 部 接口 分 开 , 这 样 使 用 该 类 的 程序 不 需要 了 解 类 的 详细 实现 ; 二 是 数据 
保护 ,即将 类 的 重要 信息 保护 起 来 ,以 免 其 他 程序 不 恰当 地 修改 。 


1322 类 对 和 象 


类 只 是 一 个 数据 类 型 ,为 了 使 用 类 ,还 必须 定义 类 的 对 象 。 在 声明 类 时 扫 -要 
系统 是 不 会 给 类 分 配 存 储 空间 的 ,只 有 在 定义 类 对 象 时 才 会 给 对 象 分 配 相 
应 的 内 存 空间 。 


生字 茧 硬是 双 得 于 


定义 类 对 象 的 格式 如 下 : 




















类 名 对 象 名 表 ; 


其 中 ,“ 类 名 "是 待定 的 对 象 所属 的 类 的 名 称 , 即 所 定义 的 对 象 是 该 类 的 对 象 。“ 对 象 名 表 ” 中 

可 以 有 一 个 或 多 个 对 象 名 ,多 个 对 象 名 之 间 用 逗号 分 隔 。 在 "对象 名 表 " 中 可 以 是 一 般 的 对 象 

名 ,还 可 以 是 指向 对 象 的 指针 名 ( 即 对 象 指针 ) 或 引用 名 ( 即 对 象 引 用 ) ,也 可 以 是 对 象 数组 名 。 
例如 ,在 类 Sample 声明 好 之 后 ,以 下 语句 用 于 定义 它 的 对 象 ; 


Sample objl,obj2，* pobj,obj[10] ; 


其 中 ,objl 和 obj2 是 一 般 对 象 名 ; pobj 是 指向 对 象 的 指针 ; obj 是 对 象 数 组 , 它 有 10 个 元 
素 ,每 个 元 素 都 是 一 个 对 象 。 
在 C++ 中, 对象 指 针 、 对 象 引用 和 对 象 数 组 的 使 用 方法 与 普通 指针 、 引 用 和 数组 类 似 。 
类 对 象 实例 化 就 是 分 配 类 对 象 所 指向 的 空间 ,通过 new 运算 符 (类 似 malloc 函数 ) 实 
现 , 例 如 ， 


Sample * p = new Sample() ; 


可 以 通过 delete 运算 符 (类 似 free 函数 ) 释 放 其 指向 的 空间 ,例如 : 


delete p; 


2 对 得 成员 的 表 个 方 六 





一 个 对 象 的 成 员 就 是 该 对 象 的 类 所 声明 的 成 员 。 对 象 成 员 有 数据 成 员 和 成 员 函 数 。 一 
般 对 象 的 成 员 表示 如 下 : 


对 象 名 .成 员 名 
或 者 
对 象 名 .成员 名 (参数 表 ) 


前 者 用 于 表示 数据 成 员 , 后 者 用 于 表示 成 员 函 数 。 这 里 的 “. "是 一 个 运算 符 ,该 运算 符 
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的 功能 是 表示 对 象 的 成 员 。 
例如 ,前 面 定 义 的 objl 的 数据 成 员 表示 为 : 


objl.i,objl.j,objl.k 


objl 的 成 员 函 数 表示 为 : 


objl. setvalue() ,objl.display() 
对 象 指针 的 成 员 表 示 如 下 : 
对 象 指针 名 一 > 成 员 名 

或 者 : 
对 象 指针 名 一 > 成 员 名 (参数 表 ) 


同样 ,前 者 用 于 表示 数据 成 员 ,后 者 用 于 表示 成 员 函 数 。 这 里 的 “一 >" 是 一 个 表示 成 员 
的 运算 符 , 它 与 前 面 介 绍 过 的 “. "运算 符 的 区 别 是 “一 >” 用 来 表示 指向 对 象 的 指针 的 成 员 ， 
而 “. ”用 来 表示 一 般 对 象 的 成 员 。 

对 于 数据 成 员 和 成 员 函 数 ,以 下 两 种 表示 方式 是 等 价 的 : 

。 对 象 指 针 名 一 > 成 员 名 

。(x* 对 象 指针 名 ). 成 员 名 


1323 构造 函数 和 析 构 函数 


构造 函数 和 析 构 函数 都 是 类 的 成 员 函 数 , 但 它们 是 特殊 的 成 员 函 数 ,不 用 调用 便 自 动 执 
行 ,而 且 这 些 函 数 的 名 称 与 类 的 名 称 有 关 。 


在 刚 定义 类 的 对 象 时 一 般 都 需要 有 初始 值 ,如 给 上 例 的 Sample 类 的 zx 
和 > 赋 初 值 。 但 在 类 声明 体 中 不 能 在 定义 时 初始 化 成 员 变量 ,那么 该 怎么 
办 ? 在 Sample 类 中 使 用 了 一 个 setpoint 函数 来 实现 ,在 每 次 使 用 一 个 新 的 “| 回 区 格 泡 
对 象 前 调用 一 下 该 函数 就 可 以 初始 化 需要 的 成 员 变量 .但 是 这 种 方法 既 不 。 如 注 
方便 也 容易 忘记 ,如 果 用 户 不 小 心 忘记 了 调用 setpoint 来 初始 化 类 对 象 ,那么 结果 就 可 能 出 
错 。C++ 提 供 了 一 个 更 好 的 方法 , 即 利 用 类 的 构造 函数 来 初始 化 类 的 数据 成 员 。 

构造 函数 是 类 的 一 个 特殊 成 员 函 数 , 它 与 类 同名 ,并 且 没 有 返回 值 。C++ 在 创建 一 个 对 



























象 时 会 自动 调用 该 类 的 “构造 函数 ”, 在 构造 函数 中 可 以 执行 初始 化 成 员 变 量 的 操作 。 例 如 ， mw 


以 下 是 一 个 构造 函数 的 声明 示例 : 


class Sample 
{ 
public: 
Sample( 参 数 表 ); 
} 
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构造 函数 可 以 像 普通 函数 一 样 被 重 载 ,C++ 根 据 声明 中 的 参数 个 数 和 类 型 选择 合适 的 
构造 函数 。 
【 例 13.2】 分 析 以 下 程序 的 执行 结果 。 


#include < iostream > 
using namespace std; 
class Sample2 

{ 


int value; 

public: 
Sample2() { value=0; } // 构 造 函 数 
Sample2(int v) { value=v; } // 重 载 构造 函数 


int getvalue() { return value; } 
void setvalue(int v) { value=v; } 
}; 
int main( ) 
{ Sample2 a[10] 王 {0,1,2,3,4,5,6,7,8,9},b[10] ; 
cout << "输出 a:" << endl; 
for (int i=0;i< 10;i 十 十 ) 
{ cout<<"a[" <<i<<"]=" <<a[i].getvalue() << " "; 
if ((i+1)%5==0) // 每 输出 5 个 元 素 换 一 行 
cout << endl; 
} 
cout << "输出 b:" << endl; 
for (int i=0;i<10;i++) 
{ cout<<"b[" <<i<<"]="<<b[].getvalue() <<" "; 
if ((i+1)%5==0) // 每 输出 5 个 元 素 换 一 行 
cout << endl; 
} 


return 1; 


上 述 程序 说 明了 类 对 象 数组 的 使 用 方法 。 在 程序 中 定义 对 象 数组 时 编译 器 调用 适 
当 的 类 构造 函数 建立 数组 的 每 个 分 量 。 这 里 的 a 数组 有 10 个 元 素 , 赋 有 初 值 ,编译 器 调用 
重 载 构造 函数 Sample2(int v) 构 造 对 象 ,所 以 a 的 定义 等 价 于 : 


Sample2 a[10] = {Sample2(0), Sample2(1), Sample2(2), Sample2(3), Sample2(4), Sample2(5), 
Sample2(6), Sample2(7), Sample2(8), Sample2(9)} 


2 数组 也 有 10 个 元 素 ,没有 赋 初 值 ,编译 器 调用 第 一 个 构造 函数 Sample2() 构 造 对 象 ， 
所 以 2 的 定义 等 价 于 : 


Sample2 b[10] = {Sample2(0), Sample2(0), Sample2(0), Sample2(0), Sample2(0), Sample2(0), 
Sample2(0), Sample2(0), Sample2(0), Sample2(0)} 


采用 面向 对 象 的 方法 描述 算法 








程序 的 执行 结果 如 下 : 


输出 a: 
a[0] =0 a[1]=1 a[2] =2 a[3] =3 a[4]=4 
a[5] =5 a[6] =6 a[7] =7 a[8] =8 a[9] =9 
输出 b: 
b[0] =0 b[1] =0 b[2] =0 b[3] =0 b[4] =0 
b[5] =0 b[6] =0 b[7] =0 b[8] =0 b[9] =0 


一 个 类 可 能 在 构造 函数 里 分 配 了 资源 ,这 些 资源 需要 在 对 象 不 复 存在 以 前 被 释放 。 合 
如 ,如 果 构 造 函 数 中 分 配 了 内 存 , 这 块 内 存在 对 象 消失 之 前 必须 被 释放 。 

与 构造 函数 对 应 的 是 析 构 函数 。 当 一 个 对 象 消失 ,或 用 new 创建 的 对 象 用 delete 删除 
时 ,由 系统 自动 调用 类 的 析 构 丽 数 。 析 构 丽 数 各 称 为 符号 *~…" 加 类 名 , 析 构 函数 没有 参数 和 
返回 值 。 在 一 个 类 中 只 可 能 定义 一 个 析 构 函数 ,所 以 析 构 琢 数 不 能 重 载 。 以 下 是 一 个 析 构 
函数 声明 的 示例 : 


























class Sample 

{ 

public: 
~Sample(); 

} 


在 析 构 函数 中 一 般 做 一 些 清除 工作 ,在 C++ 中 ,清除 就 像 初始 化 一 样 重要 。 通 过 析 构 函 
数 来 保证 执行 清除 。 

当 对 象 超出 其 定义 范围 时 ( 即 释 放 该 对 象 时 ) 编 译 器 自动 调用 析 构 函数 ,在 以 下 情况 下 
析 构 函数 也 会 被 自动 调用 : 

(1) 若 一 个 对 象 被 定义 在 一 个 函数 体内 , 则 当 这 个 函数 结束 时 该 对 象 的 析 构 函数 被 自 
动 调用 。 

(2) 若 一 个 对 象 是 使 用 new 运算 符 动态 创建 的 ,在 使 用 delete 运算 符 释 放 它 时 delete 
将 会 自动 调用 析 构 函数 。 

【 例 13.3】 分 析 以 下 程序 的 执行 结果 。 


#include < iostream > 
using namespace std; 


class Sample3 
{ 
intx, y; 
public: 
Sample3(int xl,int yl) // 构 造 函 数 
tx 
~Sample3() // 析 构 函 数 


{ cout << "调用 析 构 函数 ." << endl;} 
void dispoint() 
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{ cout<< "(" << x<< ","<<y<<")"<<endl;} 
和 
int main() 
{ Sample3 a(12,6), * p=new Sample3(5,12); // 对 象 指针 指向 创建 的 无 名 对 象 
cout << "First point=>"; 
a.dispoint(); 
cout << "Second point=>"; 
p—> dispoint(); 
//delete p; 
return 1; 


} 
本 程序 的 执行 结果 如 下 。 


First point=>(12,6) 
Second point=>(5,12) 
调用 析 构 函数 . 


从 程序 的 执行 结果 看 到 ,对 于 一 般 类 对 象 ,系统 会 自动 释放 并 自动 调用 析 构 函数 ,程序 
中 的 对 象 a 就 是 这 样 的 。 对 于 用 new 运算 符 创建 的 对 象 ,必须 在 使 用 delete 运算 符 释放 时 
才 调 用 析 构 函数 ,本 程序 中 的 对 象 指针 p 没有 使 用 delete 释放 , 故 未 调用 析 构 函数 。 若 除去 代 
码 中 delete p 语句 前 的 注释 符号 , 则 会 自动 调用 析 构 函数 ,结果 显示 两 次 "调用 析 构 函数 ”。 


1324 模板 类 


模板 (template) 用 于 把 函数 或 类 要 处 理 的 数据 类 型 参数 化 ,表现 为 参数 的 多 态 性 。 模 
板 用 于 表达 逮 辑 结构 相同 , 且 具 体 数 据 元 素 类 型 不 同 的 数据 对 象 的 通用 行为 ,从 而 使 程序 可 
以 从 人 逻辑 功能 上 抽象 ,把 被 处 理 的 对 象 (数据 ) 类 型 作为 参数 传递 。 要- 要 

类 模板 使 用 户 可 以 为 类 声明 一 种 模式 ,使 得 类 中 的 某 些 数据 成 员 、 成 员 
函数 的 参数 和 返回 值 能 取 任意 数据 类 型 。 类 模板 用 于 实现 类 所 需 数 据 的 类 
型 参数 化 。 类 模板 在 表示 数据 结构 (如 数组 .二叉树 和 图 等 ) 时 显得 特别 重 上 和 站 
要 ,这 些 数 据 结构 的 表示 和 算法 不 受 所 包含 的 元 素 类 型 的 影响 。 视频 讲 解 

声明 类 模板 的 一 般 格式 如 下 : 

















template 类 型 形 参 表 
class 类 模板 名 
{ 
类 声明 体 ; 
}; 
template 类 型 形 参 表 
返回 类 型 类 名 类 型 名 表 : :成员 函 数 1( 形 参 表 ) 
{ 
成 员 函 数 定义 体 ; 
1 


采用 面向 对 象 的 方法 描述 算法 








template 类 型 形 参 表 
返回 类 型 类 名 类 型 名 表 : :成 员 函 数 n( 形 参 表 ) 
{ 
成 员 函 数 定义 体 ; 
} 


其 中 的 “类 型 形 参 表 ” 与 函数 模板 中 的 意义 一 样 。 在 后 面 的 成 员 函 数 定义 中 ,“ 类 型 名 表 ” 是 
类 型 形 参 的 使 用 。“ 类 型 形 参 表 ” 中 的 形 参 要 加 上 “class” 或 “typename” 关 键 词 。 类 型 形 参 
可 以 是 C++ 中 的 任何 基本 的 或 用 户 定义 的 类 型 。 对 于 在 形 参 表 中 定义 的 每 个 类 型 ,必须 要 
使 用 关键 词 class 或 typename。 如 果 类 型 形 参 多 于 一 个 , 则 每 个 形 参 都 要 使 用 关键 词 class 
或 typename。 

同样 ,类 模板 不 能 直接 使 用 ,必须 先 实例 化 为 相应 的 模板 类 ,再 定义 该 模板 类 的 对 象 后 
才能 使 用 ,如 图 13. 2 所 示 。 在 定义 类 模板 之 后 ,创建 模板 类 的 一 般 格式 如 下 : 


类 模板 名 < 类 型 实 参 表 > 对 象 表 ; 


其 中 ,“ 类 型 实 参 表 ” 应 与 该 类 模板 中 的 “类 型 形 参 表 ” 相 匹配 。“ 对 象 表 ” 是 定义 该 模板 类 的 
一 个 或 多 个 对 象 。 


实 a 类 类 的 对 
(Gun) pe 


图 13.2 类 模板 ,模板 类 和 类 对 象 之 间 的 关系 





【 例 13.4】 分 析 以 下 程序 的 功能 。 


#include < iostream> 
using namespace std; 
template < typename T> 
class Array 


{ int size; 
T x data; //T 为 类 型 参数 
public: 
Array(int); // 构 造 函数 
一 Array(); // 析 构 函 数 
void setvalue() ; // 输 入 数组 元 素 
void dispvalue(); // 输 出 所 有 数组 元 素 


}; 


template <typename T> 


Array < T>:: Array(int n) // 构 造 函 数 
{ size=n; 
data 一 new T[n]; // 为 动态 数组 分 配 内 存 空间 


} 


template < typename 工 > 
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Array < T>:: ~Array() // 析 构 函 数 
{ delete [] data; } 
template <typename T> 
void Array < T >:: setvalue() 
{ cout<< "(输入 " << size << "个 数据 )" << endl; 
for (int i=0;i< sizeii 十 十 ) 
{ cout<<"” 第 " << i 十 1 << "个 数据 :"; 
cin >> data[] ; 
} 
} 
template <typename T> 
void Array < T >::dispvalue() 
{ for (inti=0;i< sizeii 十 十 ) 
cout << data[i] << " "; 
cout << endl; 
} 
int main( ) 
{ Array<char> ac(2); //Array < char > 为 模板 类 ,ac(2) 定 义 模板 类 的 对 象 
cout << "建立 一 个 字符 数组 "; 
ac. setvalue(); 
cout<<" 数组 的 内 容 是 :"; 
ac. dispvalue(); 
Array < int > ad(3); //Array < int > 为 模板 类 ,ad(3) 定 义 模板 类 的 对 象 
cout << "建立 一 个 整数 数组 :" ; 
ad. setvalue(); 
cout<<"” 数组 的 内 容 是 :"; 
ad. dispvalue(); 
return 1; 


b 


在 上 述 程 序 中 声明 了 一 个 类 模板 Array <T>, 其 私有 数据 成 员 size 是 一 个 整数 , 表 
示 动 态 数 组 的 大 小 ,还 有 一 个 指针 data, 当 实例 化 模板 类 时 它 指向 相应 类 型 数组 的 元 素 ,在 
构造 函数 中 为 类 型 的 数组 分 配 指 定 大 小 的 空间 ,在 析 构 函数 中 释放 所 分 配 的 空间 。 在 
main 函数 中 定义 了 两 个 模板 类 ac 和 ad, 分 别 是 大 小 为 2 的 字符 数组 和 大 小 为 3 的 整数 数 
组 ,通过 调用 相应 的 成 员 函 数 实现 数组 的 输入 和 输出 功能 。 





用 C++ 描述 数据 结构 算法 








数据 结构 采用 面向 对 象 方法 实现 时 通常 用 类 模板 来 描述 ,这 是 由 于 数 
据 结构 关注 的 是 数据 元 素 及 其 关系 是 如 何 保存 的 ,基于 这 些 关系 的 运算 是 
如 何 实现 的 ,而 数据 元 素 可 以 是 任意 类 型 。 使 用 类 模板 来 描述 ,可 以 避免 对 0 
于 具体 数据 元 素 类 型 的 依赖 。 本 节 通过 设计 顺序 表 类 模板 和 链 栈 类 模板 来 。 ”mi 














第 13 人 章 几 ”采用 面向 对 象 的 方法 描述 算法 








说 明 采 用 面向 对 象 方法 描述 数据 结构 算法 的 基本 思想 。 


1331 顺序 表 类 模板 


有 关 顺 序 表 的 基本 运算 算法 参见 第 2 章 ,这 里 不 再 介绍 。 
在 设计 顺序 表 类 时 有 两 个 私有 数据 成 员 ,pelem 指针 指向 顺序 
表 的 数据 ,length 指出 当前 顺序 表 中 数据 元 素 的 个 数 。 另 外 ， Th i 
将 初始 化 顺序 表 的 功能 用 构造 函数 实现 (分 配 MaxSize 大 小 的 DispList 
空间 ,由 pelem 指针 指向 它 ) ,释放 顺序 表 的 功能 用 析 构 函数 实 en 
现 (释放 pelem 指针 所 指向 的 空间 )。 顺 序 表 的 其 他 基本 运算 Listinsert 
由 该 类 中 的 其 他 成 员 函 数 实现 。 顺 序 表 类 SqList 如 图 13. 3 ListDelete 
所 示 。 








SqList 


length 








为 了 通用 ,设计 顺序 表 类 模板 SqList< 了 > 如下: 本 
template < typename 工 > 
class SqList // 顺 序 表 类 模板 
{ Tx*pelem; 
int length; 
public: 
SqList(int n) // 构 造 函 数 ,用 于 初始 化 顺序 表 
{ pelem=new T[n]; 
length=0; 
} 
~SqList() // 析 构 函 数 ,用 于 释放 分 配 的 空间 
{ delete pelem;)} 
bool ListEmpty() // 判 断 线性 表 是 否 为 空 表 


{ 
return(length==0); 
} 
int ListLength() // 求 线性 表 的 长 度 
return(length) ; 
} 
void DispList() // 输 出 线性 表 
{ intis 
if (ListEmpty()) return; 
cout << "顺序 表 :"; 
for (i 一 0;i<length;i 十 十 ) 
cout<< pelem[] << ""; 





cout << endl; | 


} 
bool GetElem(int i, T&e) // 求 线性 表 中 的 某 个 数据 元 素 值 
{ if(i<l | i>length) 
return false; 

e=pelem[i—1]; 

return true; 
} 
int LoacteElem(T e) // 按 元 素 值 查找 
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{ inti=0; 
while (i< length && pelem[i]!=e) i 十 十 ; 
if (i>=length)return 0; 
else return i 十 1; 
} 
bool ListInsert(inti, T e) // 插 入 数据 元 素 
if (i<1 | i>length 十 1) 
return false; 
和 // 将 顺序 表 位 序 转化 为 pelem 下 标 
for (j=length;j > ij 一 一 ) // 将 pelem[ 品 及 后 面 的 元 素 后 移 一 个 位 置 
pelem[D] 王 pelemD 一 巧 ; 
pelem[i] =e; 
length 十 十 ; // 顺 序 表 的 长 度 增 1 
return true; 
} 
bool ListDelete(inti, T &e) // 删 除数 据 元 素 
{intj; 
if (i<1 | i> length) return false; 
i // 将 顺序 表 位 序 转化 为 pelem 下 标 
e=pelem[i] ; 
人 
pelem[j] = pelem[D+1]; 
length 一 一 ; 
return true; 


在 设计 好 SqList<T > 类 模板 之 后 可 以 定义 模板 类 及 其 对 象 , 并 通过 这 个 对 象 调用 成 员 
函数 来 实现 顺序 表 的 功能 。 例 如 ,设计 以 下 主 函 数 : 


int main( ) 
{ chare;inti; 
SqList < char > s(10); // 定 义 一 个 大 小 为 10 的 字符 顺序 表 对 象 s 


s. ListInsert(1, 'a'); 
s. ListInsert(2, 'b'); 
s. ListInsert(3, 'c'); 
s. ListInsert(4, 'd'); 
s. DispList(); 
s.GetElem(2, e); 





| cout << "第 2 个 结 点 值 :" << e << endl; 


i=s. LoacteElem( 'd'); 

cout << "数据 值 为 d 的 结 点 序号 为 " << i << endl; 
cout << "删除 第 2 个 结 点 " << endl; 

s. ListDelete(2, e); 

s. DispList(); 

cout << "删除 第 3 个 结 点 " << endl; 

s. ListDelete(3, e); 

s. DispList(); 
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cout << "插入 e 作 为 第 1 个 结 点 " << endl; 
s. ListInsert(1, 'e'); 

s. DispList(); 

cout << "插入 作为 第 3 个 结 点 " << endl; 
s. ListInsert(3, 'f'); 

s.DispList() ; 

return 1; 


} 
其 执行 结果 如 下 : 


顺序 表 :abcd 

第 2 个 结 点 值 : b 

数据 值 为 d 的 结 点 的 序号 为 4 
删除 第 2 个 结 点 
顺序 表 :acd 

删除 第 3 个 结 点 
顺序 表 :ac 

插入 e 作 为 第 1 个 结 点 
顺序 表 :eac 

插入 f 作为 第 3 个 结 点 
顺序 表 :eafc 


上 述 主 函 数 中 定义 的 是 字符 顺序 表 , 如 果 需 要 使 用 实数 顺序 表 sl, 也 可 以 直接 从 
SqlList<T > 中 产生 ,例如 : 


SqList < double> s1(20); // 定 义 一 个 大 小 为 20 的 实数 顺序 表 对 象 sl 


1332 链 栈 类 模板 


有 关 栈 的 基本 运算 算法 参见 第 3 章 , 这 里 不 再 介绍 。 在 设 
计 链 栈 类 时 只 有 一 个 私有 数据 成 员 lhead, 它 作为 链 栈 对 应 的 ee 
单 链表 的 头 结 点 指针 , 单 链 表 结 点 的 类 型 为 NodeType( 其 定 [stackEmpt 
义 见 以 下 代码 )。 另 外 ,将 初始 化 链 栈 的 功能 用 构造 函数 实现 
(创建 一 个 头 结 点 ,其 next 域 为 NULL, 并 由 lhead 指向 这 个 头 GetTop 
结 点 ) ,释放 链 栈 的 功能 用 析 构 函数 实现 (释放 链 栈 对 应 的 单 链 
表 的 所 有 结 点 空间 )。 栈 的 其 他 基本 运算 由 该 类 中 的 其 他 成 员 图 13.4 Listack 类 
函数 实现 。 链 栈 类 LiStack 如 图 13.4 所 示 。 

为 了 通用 ,设计 链 栈 类 模板 LiStack < 本 > 如 下 : 

















template < typename T> 


struct NodeType // 单 链表 结 点 的 类 型 
{ Tdata; // 数 据 域 
NodeType * next; // 指 针 域 


}; 
template <typename 工 > 
class LiStack 
{ 

NodeType<T> * lhead; 
public: 

LiStack() 


lhead —> next= NULL; 
} 
~LiStack() 


while (p!=NULL) 
{ delete lhead; 
lhead=p; 
p=p—> next; 
} 
delete lhead; 
} 
intStackEmpty() 


} 

void Push(T e) 

{ NodeType<T> *p; 
p=new NodeType < T >(); 
p 一 > data=e; 
p 一 > next= lhead 一 > next; 
lhead -> next=p; 

} 

bool Pop(T &e) 

{ NodeType<T> *p; 
if (lhead -> next== NULL) 

return false; 

p=lhead 一 > next; 
e=p—> data; 
lhead 一 > next=p 一 > next; 
delete p; 
return true; 





P } 


boolGetTop(T &e) 
{ if (lhead—>next==NULL) 
return false; 
e 一 ]head 一 > next 一 > data; 
return true; 


{ lhead=new NodeType<T>(); 
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// 链 栈 类 模板 


// 单 链表 的 头 结 点 指针 


// 构 造 函 数 ,初始 化 栈 


// 析 构 函 数 ,销毁 栈 


{ NodeType<T> * p 一 lhead 一 > next; 


// 释 放 头 结 点 空间 


// 判 断 栈 是 否 为 空 


return(lhead 一 > next== NULL):; 


// 进 栈 


// 插 入 p 结 点 作为 第 一 个 数据 结 点 


// 出 栈 
// 栈 空 的 情况 


//p 指向 第 一 个 数据 结 点 


// 取 栈 顶 元 素 
// 栈 空 的 情况 


使 用 STL 设计 数据 结构 算法 光 


STL 最 早 由 惠普 实验 室 开 发 完成 , 它 是 以 C 中 的 模板 语法 为 基础 建立 起 来 的 一 套 包含 
基础 数据 结构 和 算法 的 代码 库 。STL 的 特点 是 实现 了 “类 型 参数 化 ”, 即 STL 的 代码 中 可 


处 理 任意 自 定义 类 型 的 对 象 。 


STL 中 提供 的 容器 用 来 保存 数据 ,涵盖 了 许多 数据 结构 ,例如 前 面 章节 中 介绍 的 链表 、 
栈 和 队列 等 。 在 实际 的 开发 过 程 中 可 以 直接 使 用 ,不 仅 简化 了 许多 重复 乏味 的 工作 ,而 且 


BO TI 


提高 了 软件 开发 的 效率 。 
容器 部 分 主要 由 头 文件 < vector >、< list>,< deque >,< set >,< map >、 
< stack > 和 < queue > 组 成 。 表 13. 1 列 出 了 STL 提供 的 数据 结构 和 相应 头 


文件 的 对 应 关系 (其 中 ， 


用 * 标识 的 以 hash_ 开 头 的 4 个 容器 必须 存在 一 个 


键 值 的 哈 希 函数 ,它们 不 是 C++ 标准 库 的 部 分 ) 。 
为 此 ,在 使 用 STL 时 必须 将 以 下 语句 插入 到 源 代码 文件 开头 : 


using namespace std; 


这 样 直接 把 程序 代码 定位 到 std 命名 空间 中 。 


表 13.1 数据 结构 和 相应 头 文件 的 对 应 关系 
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数据 结构 说 明 实现 头 文件 

向 量 (vector) 连续 存储 元 素 。 底 层 数据 结构 为 数组 ,支持 快速 随机 访问 <vector> 

链表 (list) 由 结 点 组 成 的 双向 链表 ,每 个 结 点 包含 着 一 个 元 素 。 底 层 数据 ts 
结构 为 双向 链表 ,支持 快速 增删 

模 (stack) 后 进 先 出 的 序列 。 底 层 一 般 用 list 或 deque 实现 ,封闭 头 部 即 有 
可 ,不 用 vector 的 原因 应 该 是 容量 大 小 有 限制 ,扩容 耗 时 

队列 (queue) 先进 先 出 的 序列 。 底 层 一 般 用 list 或 deque 实现 ,封闭 头 部 即 ey 
可 ,不 用 vector 的 原因 应 该 是 容量 大 小 有 限制 ,扩容 耗 时 
连续 存储 的 指向 不 同 元 素 的 指针 所 组 成 的 数组 。 底 层 数据 结 

双 队列 (deque) 构 为 一 个 中 央 控 制 器 和 多 个 缓冲 区 ,支持 首尾 (中 间 不 能 ) 快 速 。 < deque> 


增删 ,也 支持 随机 访问 





优先 队列 (priority_queue) 


元 素 的 次 序 是 由 作用 于 所 存储 的 值 上 的 某 种 谓词 决定 的 一 种 
队列 。 底 层 数 据 结 构 一 般 为 vector 作为 底层 容器 , 堆 heap 作 
为 处 理 规则 来 管理 底层 容器 实现 


<queue> 





集合 (set) 


由 结 点 组 成 的 红 黑 树 , 每 个 结 点 都 包含 着 一 个 元 素 , 结 点 之 间 
以 某 种 作用 于 元 素 对 的 谓词 排列 ,没有 两 个 不 同 的 元 素 能 够 拥 
有 相同 的 次 序 。 底 层 数据 结构 为 红 黑 树 ,有 序 ,不 重复 


<set> 





多 重 集合 (multiset) 





允许 存在 两 个 次 序 相等 的 元 素 的 集合 。 底 层 数 据 结构 为 红 黑 
树 , 有 序 ,可 重复 


<set> 














EEE \ 目 DG 









































续 表 
数据 结构 说 明 实现 头 文件 
映射 (map) 由 (关键 字 , 值 ) 对 组 成 的 集合 ,以 某 种 作用 于 关键 字 上 的 谓词 
排列 。 底 层 数据 结构 为 红 黑 树 , 有 序 ,不 重复 
多 重 映射 (multimap) 允许 关键 字 相 等 的 次 序 的 映射 。 底 层 数 据 结构 为 红 黑 树 , 有 < > 
序 , 可 重复 
hash_set * 类 似 于 集合 ,底层 数据 结构 为 哈 希 表 , 无 序 , 不 重复 <hash_set> 
hash_multiset * 类 似 于 多 集合 ,底层 数据 结构 为 哈 希 表 ,无 序 , 可 重复 <hash set> 
hash_map* 类 似 于 映射 ,底层 数据 结构 为 哈 希 表 , 无 序 , 不 重复 <hash_map> 
hash_multimap * 类 似 于 多 映射 ,底层 数据 结构 为 哈 希 表 ,无 序 , 可 重复 <hash_map> 
下 面 介绍 几 种 常用 的 容器 。 扫 - 要 
它 是 一 个 向 量 类 模板 。 向 量 容 器 相当 于 数组 , 它 存储 具有 相同 数据 类 
型 的 一 组 元 素 , 可 以 从 后 面 快 速 地 插入 与 删除 元 素 ,快速 地 随机 访问 元 素 ， 








但 是 在 序列 中 间 插 人、 删除 元 素 较 慢 ,因为 需要 移动 插入 或 删除 处 后 面 的 所 机 
有 元 素 。 而 且 如 果 一 开始 分 配 的 空间 不 够 ,重新 分 配 更 大 的 空间 时 需要 进行 大 量 的 元 素 复 
制 ,从 而 增加 了 性 能 开销 。 

以 下 语句 定义 一 个 整数 向 量 对象 test: 


Vector< int > test; 


这 样 只 定义 一 个 空 的 容器 ,其 中 没有 任何 数据 ,vector 提供 了 一 系列 的 成 员 函 数 ,可 以 
使 用 它们 对 定义 的 test 容器 进行 操作 。vector 主要 的 成 员 函 数 如 下 。 
。 max_size(): 容器 中 能 保存 的 最 大 元 素数 量 。 
。 size(): 当前 容器 中 的 实际 元 素 个 数 。 
push_back(): 在 vector 的 尾部 添加 了 一 个 元 素 。 
insert() : 将 元 素 插 入 到 指定 元 素 之 前 。 
empty(): 判断 vector 是 否 为 空 。 
front(): 取得 vector 的 第 一 个 元 素 。 
back(): 取得 vector 的 最 后 一 个 元 素 。 
erase() : 去 掉 某 个 区 间 指 定 的 元 素 。 
clear() : 删除 所 有 元 素 。 
begin(): 引用 容器 中 的 第 一 个 元 素 。 
。 end() : 引用 容器 中 最 后 一 个 元 素 后 面 的 一 个 位 置 。 
【 例 13.5】 分 析 以 下 程序 的 执行 结果 。 





#include <iostream> 
# include < vector > 
#include < algorithm > 
using namespace std; 
int main() 


采用 面向 对 象 的 方法 描述 算法 








{vector<int> v(3); // 定 义 初始 长 度 为 3 的 整数 容器 
v[0]=5; // 下 标 0 处 放置 元 素 5 
v[1]=2; // 下 标 1 处 放置 元 素 2 
v.push_back(7); // 在 尾部 插入 元 素 7 
Vector < int >: : iterator first=v. begin() ; // 让 first 指向 开头 元 素 
Vector < int >: : iterator last=v. end(); // 让 last 指向 尾部 元 素 
while (first!= last) // 循 环 输出 所 有 元 素 

cout<< * firstt+ << " "; 
cout << endl; 
return 1; 
} 


在 上 述 程序 中 初始 定义 了 一 个 长 度 为 3 的 整数 向 量 v( 所 有 元 素 默 认为 0)。 在 前 两 
个 下 标 放 置 两 个 整数 ,再 在 末尾 插入 一 个 整数 7, 长 度 增加 1, 最 后 输出 所 有 整数 。 程 序 的 执 
行 结果 如 下 : 
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它 是 一 个 双 端 队列 类 模板 。 双 端 队列 容器 可 以 从 前 面 或 后 面 快速 地 插入 与 删除 元 素 ， 
并 可 以 快速 地 随机 访问 元 素 ,但 删除 元 素 较 慢 ,空间 的 重新 分 配 要 比 vector 快 ,重新 分 配 空 
间 后 原 有 的 元 素 不 需要 复制 。 若 要 对 deque 进行 排序 操作 ,可 将 deque 先 复制 到 vector, 排 
序 后 再 复制 回 deque。 
deque 的 主要 成 员 函 数 如 下 。 
。 empty(): 判断 队列 是 否 为 空 队 。 
size(): 返回 队列 中 元 素 的 个 数 。 
push_front(): 在 队 头 插入 元 素 。 
push_back(): 在 队 尾 插入 元 素 。 
pop_front(): 删除 队 头 的 一 个 元 素 。 
pop_back(): 删除 队 尾 的 一 个 元 素 。 
clear() : 删除 所 有 的 元 素 。 
begin(): 引用 容器 中 的 第 一 个 元 素 。 
end(): 引用 容器 中 最 后 一 个 元 素 后 面 的 一 个 位 置 。 
【 例 13.6】 分 析 以 下 程序 的 执行 结果 。 





#include < iostream> 
#include < deque> 

#include < algorithm > 

using namespace std; 

void disp(deque < int> &dq); 
int main() 


{ deque<int> dq; // 建 立 一 个 双 端 队列 dq 
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dq. push_front(1); // 队 头 持 入 1 
dq. push_back(2); // 队 尾 插 入 2 
dq. push_front(3); // 队 头 插 入 3 
dq. push_back(4); // 队 尾 插入 4 
disp(dq); 

dq. pop_front(); // 删 除 队 头 元 素 
dq. pop_back(); // 删 除 队 尾 元 素 
disp(dq); 

return 1; 


} 
void disp(deque < int > &dq) 
{ deque< int>::iterator iter; 
for (iter= dq. begin( ) ;iter!= dq. end() ;iter 十 十 ) 
cout<< x*iter<< " "; 
cout << endl; 


} 


在 上 述 程序 中 定义 了 字符 串 双 端 队 列 dq, 利 用 插入 和 删除 成 员 函 数 进行 操作 。 程 
序 的 执行 结果 如 下 : 


它 是 一 个 双 链 表 类 模板 ,可 以 从 任何 地 方 快速 地 插入 与 删除 。 它 的 每 个 元 素 间 用 指针 
相连 ,不 能 随机 访问 元 素 , 为 了 访问 表 容器 中 特定 的 元 素 ,必须 从 第 1 个 位 置 ( 表 头 ) 开 始 , 随 
着 指针 从 一 个 元 素 到 下 一 个 元 素 , 直 到 找到 要 找 的 元 素 。 插 和 人 元素 比 vector 快 ,对 每 个 元 
素 分 别 分 配 空间 ,所 以 不 存在 空间 不 够 重新 分 配 的 情况 。 

list 的 主要 成 员 函 数 如 下 。 

。 size(): 返回 表 中 实际 元 素 的 个 数 。 
empty(): 判断 表 是 否 为 空 。 
push_back(): 在 表 尾部 插入 元 素 。 
pop_back() : 删除 最 后 一 个 元 素 。 
remove (): 删除 所 有 指定 值 的 元 素 。 
erase: 从 容器 中 删除 一 个 或 几 个 元 素 。 
clear() : 删除 所 有 的 元 素 。 
insert(pos,elem) : 在 pos 处 插入 elem 元 素 并 返回 该 元 素 的 位 置 。 
begin(): 引用 容器 中 的 第 一 个 元 素 。 

。end(): 引用 容器 中 最 后 一 个 元 素 后 面 的 一 个 位 置 。 
【 例 13.7】 分 析 以 下 程序 的 执行 结果 。 

















# include < iostream > 
#include <list > 


using namespace std; 
int main() 
{list< int> lst; 
list < int >: :iterator i, start, end; 


lst. push_back(5) ;lst. push_back(2);lst. push_back(4); 
lst. push_back(1) ;lst.push_back(3) ;lst.push_back(8); 


lst. push_back(6) ;lst.push_back(7); 

cout << "lst: "; 

for (i=l]st. begin() ;il 一 lst.end() ;ii 十 十 ) 
cout<< *i<<""; 

cout << endl; 

i= 1st. begin() ; 

start 一 十 十 lst. begin(); 

end 王 一 一 lst.end(); 

lst. insert(i, start, end) ; 

cout << "lst. insert(i, start, end)" << endl; 

cout << "lst: "; 

for (i=l1st. begin() ;il 一 lst.end();i 十 十 ) 
cout<< xi<<""; 


cout << endl; 





return 1; 


在 上 述 程 序 中 建立 了 一 个 整数 表 对 象 lst, 向 其 中 添加 8 个 元 素 ,i 指向 元 素 5, start 
指向 元 素 2,end 指向 元 素 6 ,执行 “lst. insert(i,start,end);” 语 句 时 将 2、4、1、3、8、6 插入 到 


最 前 端 。 程 序 的 执行 结果 如 下 : 
lst:52413867 


Ist. insert(i, start, end) 
lst:24138652413867 


它 是 一 个 栈 类 模板 。 栈 具有 后 进 先 出 的 特点 。 栈 容器 必须 结合 其 他 容器 使 用 ,其 默认 
的 内 部 容器 是 deque。 它 先进 后 出 ,只 有 一 个 出 口 ,不 允许 遍历 。 


stack 的 主要 成 员 函 数 如 下 。 
。 empty(): 容器 中 没有 了 
。 size(): 返回 容器 中 当前 元 素 的 个 数 。 
。top(): 返回 栈 顶 元 素 。 

。 push() : 元 素 进 栈 。 

。 pop(): 元 素 出 栈 。 

【 例 13.8】 分 析 以 下 程序 的 执行 结 








#include < iostream> 
#include < stack> 


素 时 返回 true, 和 否则 返回 false。 


[第 人 3) 章 于 。 采 用 面向 对 象 的 方法 描述 
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using namespace std; 
int main() 
和 stack < int> st; 
st. push(1);st. push(2);st. push(3); 
cout<< st.top() << ""; 
st. pop() ;cout<< st. top() << " "; 
st. pop();st.top() = 7; 
st. push(4);st. push(5); 
st. pop(); 
while (!st.empty()) // 栈 不 空 时 输出 栈 顶 元 素 并 退 栈 


{ cout<<st.top() <<" "; 


st. pop() ; 
} 
cout << endl; 


return 1; 


} 


在 上 述 程序 中 建立 了 一 个 整数 栈 对 象 st, 进 栈 、 退 栈 若 干 元 素 ,最 后 使 用 while 循环 
语句 在 栈 不 空 时 输出 栈 顶 元 素 并 退 栈 。 程 序 的 执行 结果 如 下 : 
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它 是 一 个 队列 类 模板 。 队 列 具 有 先进 先 出 的 特点 ,队列 容器 是 受 限制 的 deque, 内 部 容 
器 一 般 使 用 list 较 简 单 。 它 先进 先 出 ,不 允许 遍历 。 
deque 的 主要 成 员 函 数 如 下 。 
。 empty(): 容器 中 没有 元 素 时 返回 true, 和 否则 返回 false 
size(): 返回 容器 中 当前 元 素 的 个 数 。 
front(): 返回 队 头 元 素 。 
back(): 返回 队 尾 元 素 
push(): 元 素 进 队 。 
pop(): 元 素 出 队 。 
【 例 13. 9】 分 析 以 下 程序 的 执行 结果 。 





#include < iostream> 

#include < queue> 

using namespace std; 

int main() 

{ queue< int> q; 
q.push(1);q.push(2);q.push(3); 
cout << q.front() << " "; 
q.pop() ;cout<< q.front() < " "; q.pop(); 
q.push(4);q.push(5); 
q: popO); 





@BO 采用 面向 对 象 的 方法 描述 算法 





while (!q.empty()) // 队 不 空 时 出 队 
{ cout<<gq.front() <<" "; 
q.pop(); 
} 
cout << endl; 
return 1; 


上 


在 上 述 程序 中 建立 了 一 个 整数 队 对 象 9, 进 队 、 出 队 若干 元 素 ,最 后 使 用 while 循环 
语句 在 队 不 空 时 输出 队 头 元 素 并 出 队 。 程 序 的 执行 结果 如 下 : 
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附录 A 实验 报告 格式 


每 次 实验 要 求 提交 完整 的 实验 报告 。 实 验 报告 的 基本 格式 如 下 ， 
一 、 设 计 人 员 相 关 信息 


1. 设计 者 姓名 、 学 号 和 班 号 。 
2. 设计 日 期 。 
3. 上 机 环境 。 


二 、 程序 设计 相关 信息 


. 实验 题目 。 

. 实验 项 目的 目的 。 

. 实验 项 目的 程序 结构 (程序 中 的 函数 调用 关系 图 ) 。 
. 实验 项 目 包含 的 各 个 文件 中 的 函数 的 功能 描述 。 
. 算法 描述 或 流程 图 。 

. 实验 数据 和 实验 结果 分 析 。 

. 实验 体会 。 


三 、 实 验 提 交 内 容 
实验 报告 .实验 源 程序 清单 和 可 执行 文件 。 


和 AwDL- 


附录 B 引用 型 参数 和 指针 引用 型 
参数 的 说 明 


在 算法 设计 中 大 量 使 用 引用 型 参数 ,引用 型 参数 是 通过 C++ 的 引用 符 
“&.” 实 现 的 ,在 Turbo C 2.0 版 本 中 不 支持 引用 类 型 ,本 书 中 带 引用 的 程序 
只 能 在 Visual C++ 6.0 和 Dev C++ 等 编译 器 中 运行 。 使 用 引用 型 参数 的 目 
的 是 为 了 将 函数 的 形 参 回 传 给 实 参 。 一 般 情况 下 , 当 算 法 中 的 形 参 作为 输 
出 型 参数 时 总 是 采用 引用 型 参数 。 人 

本 书 和 大 多 数 同类 教材 的 一 个 不 同 之 处 是 顺序 表 、 顺 序 栈 和 顺序 队列 的 相关 算法 都 使 
用 指针 引用 型 参数 。 为 什么 使 用 指针 类 型 呢 ? 这 是 因为 这 些 表 都 有 销毁 运算 ,其 功能 是 释 
放 它 们 的 存储 空间 。 

C/C++ 有 一 个 原则 ; 由 系统 自动 分 配 的 存储 空间 在 不 再 需要 时 由 系统 自动 释放 ,而 使 
用 malloc() 函 数 手工 分 配 的 存储 空间 在 不 再 需要 时 必须 使 用 free() 函 数 手工 释放 。 本 书 使 
用 指针 类 型 参数 ,在 初始 化 时 通过 malloc() 分 配 顺序 表 顺序 栈 和 顺序 队列 的 存储 空间 ,在 
不 再 需要 时 使 用 free() 函 数 释放 它们 的 存储 空间 。 

以 顺序 表 为 例 ,在 顺序 表 的 基本 运算 设计 好 之 后 设计 以 下 主 函 数 ， 




















void main() 

{ SqList * s; // 定 义 顺序 表 的 指针 s 
ElemType e; 
InitList(s); // 初 始 化 s 所 指向 的 顺序 表 
ListInsert(s, 'a', 1); // 插 入 'a' 作 为 第 1 个 元 素 
ListInsert(s, 'b', 2); // 插 入 'b' 作 为 第 2 个 元 素 
ListInsert(s, 'c', 3); // 插 入 'c' 作 为 第 3 个 元 素 
ListInsert(s, 'd', 4); // 插 入 'd' 作 为 第 4 个 元 素 
ListDelete(s, 3, e) // 删 除 第 3 个 删除 
printf(" 删 除 的 元 素 是 %c\n",e);  // 输 出 :删除 的 元 素 是 c 
printf("s:");DispList(s); // 输 出 :s:abd 
DestroyList(s); // 销 毁 s 所 指 的 顺序 表 


} 


在 执行 时 先 为 ; 分 配 一 个 地 址 空间 ,由 于 是 指针 类 型 ,所 以 仅 分 配 4 个 字 节 的 地 址 空 
间 ( 由 于 没有 初始 化 ,其 中 的 地 址 值 是 无 效 的 ) 。 执 行 InitList(s) 语 句 , 通 过 malloc 函数 分 
配 一 个 顺序 表 的 空间 ,并 让 s 指向 其 开始 位 置 ,这 样 * 指向 了 一 个 有 效 的 顺序 表 , 再 执行 插 
入 .删除 等 运算 ,最 后 调用 DestroyList(s) 将 该 顺序 表 释 放 。 

如 果 不 用 指针 型 参数 ,同样 可 以 设计 对 应 的 算法 。 以 顺序 表 为 例 ,相关 运算 算法 可 以 设 
计 如 下 : 


void InitList(SqList &L) 
L.length 一 0; // 由 于 工 的 空间 由 系统 分 配 ,不 需要 使 用 malloc 函数 手工 分 配 其 存储 空间 
} 
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int ListInsert(SqList &L,int i, ElemType e) 
人 Ta 入 
if CGi<1 | i>L.length 十 1) 
return 0; 
== 
for (j=L.length;j>i;j——) 
L.dataD]=L.data0—1]; 
L.data[i] =e; 
L.length 十 十 ; 
return 1; 
} 
void DispList(SqList L) 
{ inti; 
for (i=0;i<L.length;i+ 二 ) 
printf("%e",L. data[i]); 


@006 





// 参 数 i 错误, 返回 0 
// 将 顺序 表 逻 辑 位 序 转化 为 物理 位 序 
// 将 data 四 及 后 面 的 元 素 后 移 一 个 位 置 


// 插 人 元 素 e 
// 顺 序 表 的 长 度 增 1 


// 将 顺序 表 逻 辑 位 序 转化 为 物理 位 序 


printf("\n"); 
} 
int ListDelete( SqList &L,int i, ElemType &e) 
to intjy 

if (i<1 | i>L—> length) 

return 0; 
es 
e=L. data[i] ; 


for (j=i;j<L.length—1;j 二 十 ) 
L.dataD]=L. dataD+1]; 


// 将 data 中 之 后 的 元 素 前 移 一 个 位 置 


L.length 一 一 ; // 顺 序 表 的 长 度 减 1 
return 1; 

} 

这 样 可 以 设计 如 下 主 函数 : 

int main() 

{ SqLists; // 定 义 顺序 表 s 
ElemType e; 
InitList(s); // 初 始 化 顺序 表 s 
ListInsert(s, 'a', 1); // 插 入 'a' 作 为 第 1 个 元 素 


ListInsert(s, 'b', 2); 
ListInsert(s, 'c', 3); 
ListInsert(s, 'd', 4); 


// 插 入 'b' 作 为 第 2 个 元 素 
// 插 入 'c' 作 为 第 3 个 元 素 
// 插 入 "d' 作 为 第 4 个 元 素 


ListDelete(s,3,e) // 删 除 第 3 个 删除 
printf(" 删 除 的 元 素 是 %c\n",e);  // 输 出 :删除 的 元 素 是 c 
printf("s:");DispList(s); // 输 出 :s:abd 


return 1; 


} 


在 执行 时 先 为 ; 分 配 一 个 顺序 表 的 空间 (由 系统 自动 分 配 sizeof (SqList) 个 字 节 的 空 
间 ,该 空间 的 名 称 为 >) 。 执 行 InitList(s) 语 句 , 将 s 的 length 成 员 设置 为 0 表示 是 空 表 ,再 
执行 插入 、 删 除 等 运算 。 当 主 函数 执行 完毕 ,由 系统 自动 释放 s 占用 的 存储 空间 。 由 于 在 这 
种 方式 下 不 需要 编程 释放 存储 空间 ,也 就 无 法 编写 DestroyList(s) 算 法 了 。 
所 以 ,本 书 是 为 了 保证 顺序 表 、 顺 序 栈 和 顺序 队列 等 数据 结构 算法 实现 的 完整 性 才 使 用 
指针 型 参数 的 。 两 者 在 本 质 上 没有 差别 ,读者 只 需要 了 解 顺序 表 指针 和 顺序 表 在 使 用 上 的 


语法 差别 即 可 。 





附录 C 算法 索引 








知识 点 或 例题 编号 算法 功能 对 应 源 程序 名 章 号 
【 例 1.5】 求 一 元 二 次 方程 的 根 algorithm1-5. cpp 1 
【 例 1.9】 分 析 递 归 算法 的 时 间 复 杂 度 algorithm1-9. cpp 1 
顺序 表 顺序 表 的 基本 运算 算法 sqlist. cpp 区 
单 链表 单 链 表 的 基本 运算 算法 linklist. cpp 2 
双 链表 双 链 表 的 基本 运算 算法 dlinklist. cpp 要 
循环 单 链表 循环 单 链表 的 基本 运算 算法 clinklist. cpp 区 
循环 双 链 表 循环 双 链 表 的 基本 运算 算法 cdlinklist cpp 2 
【 例 2.3 在 顺序 表 工 中 删除 所 有 值 为 z 的 元 素 algorithm2-3. cpp 2 
【 例 2.4】 将 整数 顺序 表 工 以 第 一 个 元 素 为 分 界线 (基准 ) ”algorithm2-4. cpp 2 

进行 划分 
【 例 2.5】 将 整数 顺序 表 L 中 的 所 有 奇数 移动 到 偶数 的 。” algorithm2-5. cpp 2 
前 面 
【 例 2.6】 单 链表 工 拆 分 成 两 个 单 链表 algorithm2-6. cpp 
【 例 2.7】 删除 单 链表 工 中 最 大 元 素 的 结 点 algorithm2-7. cpp 2 
【 例 2. 8】 单 链 表 递 增 排序 algorithm2-8. cpp 3 
【 例 2.9】 双 链 表 的 所 有 结 点 逆 置 algorithm2-9. cpp 2 
【 例 2. 10】 双 链 表 递 增 排序 algorithm2-10. cpp 2 
【 例 2. 111 统计 循环 单 链 表 工 中 值 为 zx 的 结 点 个 数 algorithm2-11. cpp 2 
【 例 2. 121 在 循环 双 链 表 工 中 删除 第 一 个 值 为 x 的 结 点 algorithm2-12. cpp 
【 例 2.13】 判断 循环 双 链 表 工 中 的 数据 结 点 是 否 对 称 algorithm2-13. cpp 2 
【 例 2.14】 二 路 归并 : 采用 顺序 表 实 现 algorithm2-14-1. cpp 2 
【 例 2. 14 二 路 归并 : 采用 单 链表 实现 algorithm2-14-2. cpp 2 
【 例 2. 151 求 3 个 有 序 单 链表 的 公共 结 点 algorithm2-15. cpp 2 
【 例 2.16】 高 效 删除 有 序 单 链表 的 值 重复 结 点 algorithm2-16. cpp 2 
【 例 2. 17 求 两 个 等 长 的 有 序 顺 序 表 的 中 位 数 algorithm2-17. cpp 2 
线性 表 的 应 用 两 个 表 的 简单 自然 连接 的 算法 tablelink. cpp 2 
顺序 栈 顺序 栈 的 基本 运算 算法 sqstack. cpp 3 
链 栈 链 栈 的 基本 运算 算法 listack. cp 3 
栈 的 应 用 用 栈 求 简单 表达 式 的 值 expvalue. cpp 3 
栈 的 应 用 用 栈 求解 迷宫 问题 mgpath. cpp 3 
环形 队列 顺序 队列 (环形 队列 ) 的 基本 运算 算法 sqqueue. cpp 3 
非 环 形 队 列 顺序 队列 ( 非 环 形 队 列 ) 的 基本 运算 算法 sqqueuel. cpp 3 
队列 的 应 用 用 队列 求解 报 数 问题 number. cpp 3 
队列 的 应 用 用 队列 求解 迷宫 问题 mgpathl. cpp 3 
【 例 3.4】 判断 一 个 字符 串 是 否 为 对 称 串 algorithm3-4. cpp 3 
【 例 3.5]】 判断 表达 式 中 的 括号 是 否 配对 algorithm3-5. cpp 8 
【 例 3.7】 用 队 中 元 素 个 数 代替 队 尾 指针 的 环形 队列 algorithm3-7. cpp 入 
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续 表 
知识 点 或 例题 编号 算法 功能 对 应 源 程序 名 章 号 
【 例 3. 8 用 只 有 尾 结 点 指针 rear 的 循环 单 链表 作为 链 队 algorithm3-8. cpp 3 
【 例 3. 101 双 端 队列 算法 algorithm3-10. cpp 3 
顺序 串 顺序 串 的 基本 运算 算法 sqstring. cpp 4 
链 串 链 串 的 基本 运算 算法 listring. cpp 4 
串 模 式 匹配 BF 算法 bf. cpp 4 
串 模式 匹配 KMP 算法 kmp. cpp 4 
串 模 式 匹配 改进 的 KMP 算法 kmpl. cpp 4 
【 例 4.1】 按 字典 顺序 比较 两 个 串 * 和 + 的 大 小 algorithm 4-1. cpp 4 
【 例 4.2】 求 串 * 中 第 一 个 最 长 的 连续 相同 字符 构成 的 。 algorithm 4-2. cpp 4 
平台 
【 例 4.3】 把 串 * 中 最 先 出现 的 子 串 “ap? 改 为 “zyz” algorithm 4-3. cpp 4 
Hanoi 问题 求解 求解 Hanoi 问题 的 递归 和 非 递 归 算法 hanoi. cpp 5 
【 例 5. 1 求 n! 的 递归 算法 algorithm 5-1. cpp 5 
【 例 5.2】 求实 数 数组 A[0..n 一 1] 中 最 小 值 的 递归 算法 algorithm 5-2. cpp 5 
【 例 5.3】 求 一 个 顺序 表 中 最 大 元 素 的 递归 算法 algorithm 5-3. cpp 5 
【 例 5. 4 释放 一 个 不 带头 结 点 的 单 链表 工 中 所 有 结 点 的 。 algorithm5-4. cpp 5 
递归 算法 
【 例 5.5】 用 递归 算法 求解 从 人 口 到 出 口 的 所 有 迷宫 路 径 。 algorithm5-5. cpp 可 
稀 朴 矩阵 稀疏 矩阵 三 元 组 表示 的 基本 算法 tuples. cpp 6 
稀 朴 矩阵 稀 朴 矩阵 十 字 链 表 表 示 的 基本 运算 orthogonal. cpp 6 
广义 表 广义 表 的 基本 运算 算法 glist. cpp 6 
【 例 6.1】 利用 数组 求解 约瑟夫 问题 algorithm6-1. cpp 6 
【 例 6. 3】 求 广义 表 g 的 原子 个 数 algorithm6-3. cpp 6 
二 叉 树 二 叉 树 的 基本 运算 算法 btree. cpp 7 
二 叉 树 二 叉 树 的 3 种 递归 遍历 算法 recuorder. cpp pi 
二 叉 树 二 叉 树 的 3 种 非 递归 遍历 算法 nonrecuorder. cpp 4 
层次 遍历 二 叉 树 的 层次 遍历 算法 levelorder. cpp 有 
构造 二 叉 树 构造 二 叉 树 的 算法 createbt. cpp 党 
线索 二 叉 树 中 序 线索 二 叉 树 和 中 序 非 递 归 遍 历 算法 thread. cpp 7 
哈 夫 曼 树 创建 哈 夫 曼 树 和 哈 夫 曼 编码 的 算法 huffman. cpp i 
并 查 集 亲戚 关系 例子 对 应 的 并 查 集 求解 算法 unionfindset. cpp Ls 
【 例 7.3】 孩子 链 存 储 结构 下 树 的 基本 运算 算法 和 求 树 + algorithm7-3. cpp 多 
的 高 度 
【 例 7.4】 孩子 兄弟 链 存 储 结构 下 树 的 基本 运算 算法 和 求 ” algorithm7-4. cpp 党 
树 上 的 高 度 
【 例 7.111 计算 一 棵 给 定 二 叉 树 的 所 有 结 点 个 数 algorithm7-11. cpp 7 
【 例 7.121 输出 一 棵 给 定 二 叉 树 的 所 有 叶子 结 点 algorithm7-12. cpp et 
【 例 7.13】 求 二 叉 树 中 指定 结 点 的 层次 algorithm7-13. cpp ¥ 
【 例 7.14】 求 二 叉 树 中 指定 层次 的 结 点 个 数 algorithm7-14. cpp 7 
【 例 7.15 判断 两 棵 二 叉 树 是 否 相 似 algorithm7-15. cpp 
【 例 7.16】 输出 二 又 树 中 值 为 z 的 结 点 的 所 有 祖先 algorithm7-16. cpp 7 





454 














OOORRESEIN 生 生生 
续 表 
知识 点 或 例题 编号 算法 功能 对 应 源 程序 名 章 号 
【 例 7.17】 采用 后 序 遍 历 非 递归 算法 输出 从 根 结 点 到 每 个 algorithm7-17. cpp 7 
叶子 结 点 的 路 径 逆 序列 
【 例 7.18】 采用 层次 遍历 方法 输出 从 根 结 点 到 每 个 叶子 结 algorithm7-18. cpp 党 
点 的 路 径 逆序 列 
【 例 7.19】 将 二 叉 树 的 顺序 存储 结构 转换 成 二 叉 链 存储 ”algorithm7-19. cpp 7 
结构 
图 图 的 基本 运算 算法 graph. cpp 8 
图 遍历 DFS 算法 dfs. cpp 8 
图 遍历 BFS 算法 bfs. cpp 8 
求 最 小 生成 树 普 里 姆 算法 prim. cpp 8 
求 最 小 生成 树 克 鲁 斯 卡尔 算法 Kruskal. cpp 8 
求 最 小 生成 树 改进 的 克 鲁 斯 卡尔 算法 Kruskall. cpp 8 
求 最 短路 径 狄 克 斯 特 拉 算 法 dijkstra. cpp 8 
求 最 短路 径 弗 洛 伊 德 算法 floyd. cpp 8 
拓扑 排序 拓扑 排序 算法 topsort. cpp 8 
关键 路 径 求 AOE 网 的 关键 路 径 Keypath. cpp 8 
【 例 8.2】 邻接 矩阵 和 邻接 表 的 相互 转换 algorithm8-2. cpp 8 
【 例 8.3】 判断 无 向 图 G 是 否 连 通 algorithm8-3. cpp 8 
【 例 8. 4 判断 图 G 中 从 顶点 w 到 vw 是 否 存在 简单 路 径 algorithm8-4. cpp 8 
【 例 8.5】 输出 图 G 中 从 顶点 wx 到 w 的 一 条 简单 路 径 algorithm8-5. cpp 8 
【 例 8.6】 输出 图 G 中 从 顶点 wx 到 v 的 所 有 简单 路 径 algorithm8-6. cpp 8 
【 例 8.7】 输出 图 G 中 从 顶点 u 到 w 的 长 度 为 1 的 所 有 简 algorithm8-7. cpp 8 
单 路 径 
【 例 8. 8】 输出 一 个 有 向 图 中 通过 某 个 顶点 的 所 有 回路 algorithm 8-8. cpp 8 
【 例 8.9】 求 不 带 权 无 向 连通 图 G 中 从 顶点 wx 到 vv 的 一 条 algorithm 8-9. cpp 8 
最 短路 径 
【 例 8.10】 求 不 带 权 无 向 连通 图 G 中 距离 顶点 v 的 最 远 的 。” algorithm 8-10. cpp 8 
一 个 顶点 
线性 表 查 找 顺序 查找 算法 sqsearch. cpp 9 
线性 表 查 找 折 半 查找 算法 binsearch. cpp 9 
线性 表 查 找 分 块 查找 算法 idxsearch. cpp 9 
树 表 查找 二 叉 排 序 树 的 基本 运算 算法 bst. cpp 9 
树 表 查找 二 叉 平衡 树 的 基本 运算 算法 avl. cpp 9 
B- 树 的 基本 运算 算法 B- 树 的 基本 运算 算法 btree. cpp 9 
哈 希 表 哈 希 表 ( 开 放 定 址 法 ) 的 基本 运算 算法 hash-open. cpp 9 
哈 希 表 哈 希 表 ( 拉 链 法 ) 的 基本 运算 算法 hash-chain. cpp 9 
【 例 9.4】 求 二 叉 排 序 树 中 p 结 点 的 左 子 树 中 的 最 大 结 点 。 algorithm9-4. cpp 9 
和 右 子 树 中 的 最 小 结 点 
插入 排序 直接 插入 排序 算法 Insertsort cpp 10 
插入 排序 折 半 插入 排序 算法 JInsertsortl. cpp 10 
插入 排序 希 尔 排序 算法 Shellsort. cpp 10 


交换 排序 冒 泡 排序 算法 Bubblesort. cpp 10 
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续 表 
知识 点 或 例题 编号 算法 功能 对 应 源 程序 名 章 号 
交换 排序 快速 排序 算法 Quicksort. cpp 10 
交换 排序 改进 的 快速 排序 算法 Quicksortl. cpp 10 
选择 排序 简单 选择 排序 算法 Selectsort. cpp 10 
选择 排序 堆 排 序 算法 Heapsort. cpp 10 
归并 排序 自 底 向 上 的 二 路 归并 排序 Mergesort. cpp 10 
归并 排序 自 顶 向 下 的 二 路 归并 排序 Mergesortl. cpp 10 
基数 排序 基数 排序 算法 Radixsort. cpp 10 
面向 对 象 设计 顺序 表 类 模板 sqlist. cpp 13 
面向 对 象 设计 链 栈 类 模板 LiStack listack. cpp 13 
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附录 D 名 词 索引 


单 链表 (singly linked list) ,44 


字 母 
队列 Cqueue) ,97 
AOE 网 (activity on edge network) ,303 队 尾 (rear) ,97 
AOV 网 (activity on vertex newtork) ,301 队 头 或 队 首 (front) ,97 
AVL 树 ,333 递归 (recursion) ,147 
B- 树 (B tree) ,339 递归 出 口 (recursive exit) ,150 


B 十 树 (B 十 ， 
树 ( tree) ,345 递归 体 (recursive body) ,150 


Ey WR 对 称 和 矩阵 (symmetric matrix) ,168 
Dijkstra 算法 ,290 
Floyd 算法 ,296 对 角 和 矩阵 (diagonal matrix) ,171 
ISAM 文 件 ,418 带 权 路 径 长 度 (weighted path length,WPL) ,237 
KMP 算法 ,136 端点 (endpoint) ,254 
Kruskal 算法 ,285 顶点 的 度 (degree) ,254 
m 次 树 (mr-tree) ,191 带 权 图 (weighted graph) ,256 
Prim 算法 ,281 动态 查找 表 (dynamic search table) ,315 
VSAM 文件 ,421 堆 排 序 (heap sort) ,382 

起 多 关键 字 文件 (multiple key file) ,423 

多 重 表 文 件 (multilist file) ,423 

凸 人 表示 法 (concave representation) ,191 倒 排 文件 (inverted file) ,424 

B E 
遍历 (traversal) ,194 二 叉 树 (binary tree) ,198 
并 查 集 (disjoint-set) ,241 二 又 链 (binary linked list) ,206 
败 者 树 (tree of loser) ,404 二 叉 排序 树 (binary search tree,BST) ,324 

C 二 路 归并 排序 (2-way merge sort) ,386 


二 路 平衡 归并 (2-way balanced merge) ,404 
存储 结构 (storage structure) ,2 站 


存储 密度 (storage density) ,45 F 
型 (ab ,ADT) ，, 
抽象 数据 类 型 (abstract data type,ADT) ,13 苏 亚 多 训 Ean id 


串 (Cstring) ,122 分 块 查找 
层次 遍历 (level traversal) ,195,211 人 


层 序 编号 (level coding) ,198 G 
稠密 图 (dense graph) ,255 
查找 (search) ,315 共享 栈 (share stack) ,83 
磁盘 排序 (disk sort) ,400 广义 表 (generalized table) ,177 
磁带 排序 (tape sort) ,410 广度 优先 遍历 (Breadth First Search,BFS) ,264 
次 关键 字 (secondary key) ,415 广度 优先 生成 树 (BFS tree) ,280 
关键 路 径 (critical path) ,303 
2 关键 活动 (key activity) ,303 


多 项 式 时 间 复 杂 度 (polynomial time complexity) ,20 归并 排序 (merge sort) ,386 


数据 结构 教程 





H L 

后 继 元 素 (successor) ,4 逻辑 结构 (logical structure) ,2 
后 进 先 出 表 (last in first out,LIFO) ,79 链 式 存储 结构 (linked storage structure) ,7 
后 缀 表达 式 (postfix expression) ,87 链表 (linked list) ,43 
后 根 遍 历 (postorder traversal) ,194 链 栈 (linked stack) ,84 
环形 队列 (circular queue) ,100 链 队 (linked queue) ,104 
孩子 结 点 (children) ,192 路 径 (path) ,192,255 
孩子 链 存 储 结构 (child chain storage structure)， 路 径 长 度 (path length) ,192,255 

195 邻接 点 (adjacent) ,254 
孩子 兄弟 链 存 储 结 构 (child brother chain storage 连通 图 (connected graph) ,255 

Structure) ,197 连通 分 量 (connected component) ,255 
后 序 遍 历 (postorder traversal) ,211 邻接 矩阵 (adjacency matrix) ,256 
回路 或 环 (cycle) ,255 邻接 表 (adjacency list) ,258 
汇 点 (converge) ,303 邻接 多 重 表 (adjacency multi-list) ,263 
哈 夫 曼 树 (Huffman tree) ,237 内 查找 (Internal search) ,315 
哈 夫 曼 编码 (Huffman coding) ,239 拉链 法 (chaining) ,351 
哈 希 (或 散 列 ) 存 储 结构 (hashed storage structure) ,8 内 排序 (internal sort) ,366 


哈 希 表 (hash table) ,347 M 
哈 希 函数 (hash function) ,347 
哈 希 地 址 (hash address) ,347 
哈 希 冲突 (hash collisions) ,347 
哈 希 文件 (hashed file) ,422 


目标 串 (target string) ,134 

模式 串 (pattern string) ,134 

模式 匹配 (pattern matching) ,134 
满 m 次 树 (full m-tree) ,193 


| 满 二 叉 树 (full binary tree) ,198 
bubbl ， 
进 楼 (pushy ,79 冒 泡 排序 (bubble sort) ,374 
进 队 (enqueue) ,97 N 


假 溢出 (false overflow) ,100 


逆 邻 接 表 (inverse adjacency list) ,259 
间接 递归 (indirect recursion) ,147 





结 点 的 度 (degree of node) ,191 P 
结 点 层次 (level) ,192 平均 查找 长 度 (Average Search Length,ASL) ,315 
结 点 深度 (depth) ,192 平衡 二 叉 树 (balanced binary tree) ,333 
简单 路 径 (simple path) ,255 平衡 因子 (balance factor,bf) ,333 
简单 回路 或 简单 环 (simple cycle) ,255 平方 探测 法 (square probing) ,351 
静态 查找 表 (static search table) ,315 判定 树 (decision tree) ,318 
简单 选择 排序 (simple selection sort) ,380 排序 (sort) ,366 
基数 排序 (radix sort) ,389 
Q 
K 
前 驱 元 素 (predecessor) ,4 

开始 元 素 (first element) ,4 前 级 表达 式 (prefix expression) ,87 
空间 复杂 度 (space complexity) ,23 出 队 (dequeue) ,97 
括号 表示 法 (bracket representation) ,191 出 度 (outdegree) ,254 
开放 定 址 法 (open addressing) ,350 强 连通 图 (strongly connected graph) ,255 


快速 排序 (quick sort) ,376 强 连 通 分 量 (strongly connected component) ,255 
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入 度 (indegree) ,254 


数据 (data) ,2 

数据 元 素 (data element) ,2 

数据 项 (data item) ,2 

数据 对 象 (data object) ,2 

数据 结构 (data structure) ,2 

数组 (array) ,164 

数据 类 型 (data type) ,9 

顺序 存储 结构 (sequential storage structure) ,6 
顺序 表 (sequential list) ,33 
顺序 栈 (sequential stack) ,80 

顺序 队 (sequential queue) ,98 

顺 串 (runs) ,401 

顺序 查找 (sequential search) ,316 

算法 (algorithm) ,14 

时 间 复 杂 度 (time complexity) ,19 

双 链 表 (doubly linked list) ,44 

首 指针 (first pointer) ,44 

双 端 队列 (deques) ,113 

上 三 角 矩 阵 (upper triangular matrix) ,170 

三 元 组 表 (list of 3-tuples) ,172 

十 字 链 表 (orthogonal list) ,175,262 

树 (tree) ,190 

树 形 表示 法 (tree representation) ,190 

树 的 度 (degree of tree) ,191 

树 的 高 度 (height of tree) ,192 

树 的 深度 (depth of tree) ,192 

树 表 (tree table) ,324 

森林 (forest) ,192 

双亲 结 点 (parents) ,192 

双亲 存储 结构 (parent storage structure) ,195 
深度 优先 遍历 (Depth First Search,DFS) ,264 
生成 树 (spanning tree) ,279 
深度 优先 生成 树 (DFS tree) ,280 

生成 森林 (spanning forest) ,280 

索引 存储 结构 (indexed storage structure) ,8,321 
顺序 文件 (sequential file) ,416 

索引 表 (index table) ,8,417 

索引 文件 (indexed file) ,417 

索引 顺序 文件 (indexed sequential file) ,417 
索引 非 顺 序 文件 (indexed non-sequential file) ,417 


置 
头 指针 (Chead pointer) ,44 
退 栈 (pop),79 
图 (graph) ,253 


拓扑 序列 (topological sequence) ,301 
拓扑 排序 (topological sorb ,301 
同义词 (synonym) ,347 

桶 (bucket) ,422 


Ww 


尾 指 针 (tail pointer) ,44 

尾 递归 (tail recursion) ,147 

文 氏 图 表示 法 (venn diagram representation) ,190 
无 序 树 (unordered tree) ,192 

无 序 区 (disordered region) ,368 

图 (undirgraph) ,253 

完全 二 叉 树 (complete binary tree) ,199 
完全 图 (completed graph) ,254 

网 Cnet) ,256 

外 查找 (external search) ,315 

外 排序 (external sort) ,366 
稳定 的 (stable) ,366 

文件 (file) ,415 








x 


线性 表 (linear table) ,31 
循环 链表 (circular linked list) ,59 
先进 先 出 表 (first in first out, FIFO) ,97 
下 三 角 和 矩阵 (lower triangular matrix) ,170 
稀 朴 矩阵 (sparse matrix) ,171 
稀疏 图 (sparse graph) ,255 
兄弟 结 点 (sibling) ,192 

先 根 遍 历 (preorder traversal) ,194 

先 序 遍历 (preorder traversal) ,211 

线索 (thread) ,233 
线索 二 叉 树 (threaded binary-tree) ,233 
线性 探测 法 (linear probing) ,350 

希 尔 排 序 (shell sort) ,371 

虚 段 (dummy run) ,408 





运算 (operation) ,2 
有 序 表 (ordered lisb ,65 
有 序 树 (ordered tree) ,192 
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有 序 区 (ordered region) ,368 

有 向 图 (digraph) ,253 

有 向 无 环 图 (directed acycline graph,DAG) ,303 
原子 (atom) ,178 

叶子 结 点 (leaf) ,192 

源 点 (source) ,303 


Zz 


终端 元 素 (terminal element) ,4 

指数 时 间 复 杂 度 (exponential time complexity) ,20 
栈 (stack) ,79 

栈 顶 (top) ,79 

栈 底 (bottom) ,79 

栈 帧 (stack frame) ,152 

中 缀 表达 式 (infix expression) ,87 

直接 递归 (direct recursion) ,147 
直接 插入 排序 (straight insertion sort) ,368 
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子 串 (substring) ,122 

子 表 (sub generalized table) ,178 

子 树 (subtree) ,190 

子孙 结 点 (descendant) ,192 

子 图 (subgraph) ,255 

祖先 结 点 (ancestor) ,192 

中 序 遍 历 (inorder traversal) ,211 

最 小 生成 树 (Minimal spanning tree) ,280 

最 短路 径 (shortest path) ,290 

最 低位 优先 (least significant digit first,LSD) ,390 
最 高 位 优先 (most significant digit first, MSD) ,390 
最 佳 归 并 树 (optimal merge tree) ,408 

装填 因子 (load factor) ,348 

折 半 查找 (binary search) ,317 

折 半 插入 排序 (binary insertion sort) ,370 

主 关键 字 (primary key) ,415 


附录 E 全国 计 算 机 专业 数据 结构 
2018 年 联 考 大 纲 


【考查 目标 】 

1. 掌握 数据 结构 的 基本 概念 .基本 原理 和 基本 方法 。 

2. 掌握 数据 的 逻辑 结构 ,存储 结构 及 基本 操作 的 实现 ,能 够 对 算法 进行 基本 的 时 间 复 
杂 度 与 空间 复杂 度 的 分 析 。 

3. 能 够 运用 数据 结构 的 基本 原理 和 方法 进行 问题 的 分 析 与 求解 ,具备 采用 C 或 C++ 语 
言 设计 与 实现 算法 的 能 力 。 

一 、 线 性 表 

1. 线性 表 的 定义 和 基本 操作 。 

2. 线性 表 的 实现 。 

(1) 顺序 存储 。 

(2) 链 式 存储 。 








(3) 线性 表 的 应 用 。 A 
二 、 栈 队列 和 数组 2015 年 考研 题 讲解 
1、 栈 和 队列 的 基本 概念 。 


2. 栈 和 队列 的 顺序 存储 结构 。 扫 -- 扫 
3. 栈 和 队列 的 链 式 存 储 结 构 。 
4. 栈 和 队列 的 应 用 。 

5. 特殊 矩阵 的 压缩 存储 。 

















三 、 树 与 二 叉 树 有 
1. 树 的 基本 概念 。 2016 年 考研 题 讲解 
2. 二 叉 树 。 


(1) 二 又 树 的 定义 及 其 主要 特征 。 

(2) 二 又 树 的 顺序 存储 结构 和 链 式 存储 结构 。 
(3) 二 叉 树 的 遍历 。 

(4) 线索 二 又 树 的 基本 概念 和 构造 。 do 
3. 树 、 森 林 。 视频 讲解 
(1) 树 的 存储 结构 。 

(2) 森林 与 二 叉 树 的 转换 。 

(3) 树 和 森林 的 遍历 。 

4. 树 与 二 又 树 的 应 用 。 

(1) 二 又 排序 树 。 

(2) 平衡 二 叉 树 。 

(3) 哈 夫 曼 (Hufftman) 树 和 哈 夫 曼 编码 。 





2017 年 考研 题 讲 解 
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四 、 

1. 图 的 基本 概念 。 

2. 图 的 存储 及 基本 操作 。 
(1) 邻接 矩阵 法 。 

(2) 邻接 表 法 。 

(3) 邻接 多 重 表 ,十 字 链 表 。 
3. 图 的 遍历 。 

(1) 深度 优先 搜索 。 

(2) 广度 优先 搜索 。 

4. 图 的 基本 应 用 。 

(1) 最 小 (代价 ) 生 成 树 。 
(2) 最 短路 径 。 

(3) 拓扑 排序 。 

(4) 关键 路 径 。 

五 ,查找 

. 查找 的 基本 概念 。 

. 顺序 查找 法 。 
分 块 查找 法 。 

. 折 半 查找 法 。 

. B- 树 及 其 基本 操作 、B 十 树 的 基本 概念 。 
. 散 列 (Hash) 表 。 

. 字符 串 模 式 匹 配 。 

. 查找 算法 的 分 析 及 应 用 。 
六 ,排序 

1. 排序 的 基本 概念 。 

2. 插入 排序 。 

(1) 直接 插入 排序 。 

(2) 折 半 插 和 人 排序。 

. 起 泡 排 序 (Bubble sort) 。 
. 简单 选择 排序 。 

. 希 尔 排序 (Shell sort) 。 
. 快速 排序 。 

. 堆 排 序 。 

. 二 路 归并 排序 (Merge sort) 。 
.基数 排序 。 

10. 外 部 排序 。 

11. 各 种 排序 算法 的 比较 。 
12. 排序 算法 的 应 用 。 
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图 书 资源 支持 




















感谢 您 一 直 以 来 对 清华 版 图 书 的 支持 和 爱护 。 为 了 配合 本 书 的 使 用 ,本 书 
提供 配套 的 资源 ,有 需求 的 读者 请 扫描 下 方 的 “ 书 圈 " 微 信 公 众 号 二 维 码 , 在 图 
书 专区 下 载 ,也 可 以 拨打 电话 或 发 送 电子 邮件 咨询 。 

如 果 您 在 使 用 本 书 的 过 程 中 遇 到 了 什么 问题 ,或 者 有 相关 图 书 出 版 计划 ， 
也 请 您 发 邮件 告诉 我 们 ,以 便 我 们 更 好 地 为 您 服务 。 











































































































我 们 的 联系 方式 : 


地 址 : 北京 海淀 区 双 清 路 学 研 大 厦 A 座 707 





资源 下 载 、 样 书 申 请 


由 


邮 编 : 100084 






电 话 : 010 一 62770175 一 4604 
资源 下 载 : http://www. tup.com.cn 
电子 邮件 : weijj@tup.tsinghua. edu. cn 书 圈 


QQ: 883604( 请 写 明 您 的 单位 和 姓名 ) 





用 微 信 扫 一 扫 右 边 的 二 维 码 , 即 可 关注 清华 大 学 出 版 社 公 众 号 “ 书 圈 ”。 


平台 功能 介绍 






大 如 果 您 是 教师 ， 您 可 以 过 如 果 您 是 学 生 ， 您 可 以 
管理 课程 发 表 话题 
建立 课程 : 理 
管理 题库 加 入 课程 Soa、， RS 
发 布 试卷 a 
ge 使 用 优惠 码 和 
i 激活 序列 号 





一 达 如 何 加 入 课程 
范 azaaxa 


“找到 教材 封底 “数字 课程 入 口 ” 


人 门 范 
L 剧 开 涂 层 获取 二 维 码 ， 扫 码 进入 课程 例 鼎 







一 获取 更 多 详尽 平台 使 用 指导 可 输入 网 址 
be 了 一 http://www.wqketang.com/course/550 
站 SR 如 有 疑问 ， 可 联系 微 信 客 服 : DESTUP 

好 
TO 


义 











作文 泉 课堂 斌 北大 学 出 版 社 


WWW.WOKETANG.COM 出 品 的 在 线 学 习 平台 


